HTML文書の解析処理とモデルの抽象レベル
- 18:42:18 ceekz: HTML::TokeParser はタグやテキストを切り出すにすぎないので、ここから要素を作り出す関数を書いた場合は、HTMLパーサを書いたと言えるか。
- | 18:46:18 nsiena: @ceekz 字句解析と構文解析の違い?
- || 18:48:18 ceekz: @nsiena まさにその通りかも。
- 18:49:18 nsiena: SAX/Pull などのストリーミングパーサと DOM パーサも、それに近い関係。なのだと思ってる。
- 18:56:18 nsiena: タグと要素が、それぞれシリアライズされた文字列とデータモデルの世界の概念であるのと対応して。ストリーミングパーサとツリーパーサの扱う世界も違う。