HTML文書の解析処理とモデルの抽象レベル

  • 18:42:18 http://twitter.com/ceekz ceekz: HTML::TokeParser はタグやテキストを切り出すにすぎないので、ここから要素を作り出す関数を書いた場合は、HTMLパーサを書いたと言えるか。
  • | 18:46:18 http://twitter.com/nsiena nsiena: @ceekz 字句解析と構文解析の違い?
  • || 18:48:18 http://twitter.com/ceekz ceekz: @nsiena まさにその通りかも。
  • 18:49:18 http://twitter.com/nsiena nsiena: SAX/Pull などのストリーミングパーサと DOM パーサも、それに近い関係。なのだと思ってる。
  • 18:56:18 http://twitter.com/nsiena nsiena: タグと要素が、それぞれシリアライズされた文字列とデータモデルの世界の概念であるのと対応して。ストリーミングパーサとツリーパーサの扱う世界も違う。