パースすら困難な HTML ページの価値

往々にして、人間が見えるもの、理解できるものしか認知できないのと同じように。ソフトウェアも解釈できない/解釈困難なものは処理できないという話。むしろ、コンピュータは融通が利かないだけに。想定外 (=規格外/仕様違反) のデータを処理できるようにするには、とてもとても手間がかかるもの。どうあがいても、対処不可能なことも。

  • 14:50:14 http://twitter.com/nsiena nsiena: いかんともパースしがたいページが。これは機械的な修復も無理そうだ。腐ったコンテンツは再利用の対象外にしよう。こういう場当たり的な対応で、どれだけの開発リソースが浪費されてるのだろうなぁ。殲滅したい。
  • 14:55:14 http://twitter.com/nsiena nsiena: ブラウザで見えればいいってものじゃないよ。見えてるのは、手間をかけて作り込んだ特殊な処理のおかげだったり、誤動作の積み上げの偶然の結果だったり、するかもしれないよ。
  • 14:56:14 http://twitter.com/nsiena nsiena: できる人は、特定の環境に依存しないで、コンテンツがそれ単体で存在感を認められるようにしようよ。完全でなくてもいいから。問題が多いほど、コンテンツを活用してもらえる機会は減っちゃうよ。

HTML 文書を処理するのはブラウザだけではなくて。検索サービスを始めとして、いろいろなサービスで利用されるかもしれない。あるいは、どこかのプログラマ達が趣味で作っているとても役立つソフトウェアが活用してくれるかもしれない。

そうしたサービスやソフトウェアは、そのコンテンツを書いた人自身が使う可能性もあって。誰もが当事者になりうるわけで、他人事ではないかもしれないよ。