自分にしかできない編集作業か?
今日は、サイズが大きめの某文書の加工という仕事をした。09:30に研究室について、昼食その他の時間以外のすべての時間をその作業に費やし、21:10までかかるという大変な仕事だった。
具体的に何をやったのかといえば、A4で50ページの pLaTeX2e 形式の文書を html のファイルすることであった。
最初、latex2html でも使おうか…と google であちこちを見たら、「FreeBSDのportsにある」との記述を発見した。そこで、早速 build しようかと思ったのだが、buildが全くできない。どうも、portsのメンテナンスメンバーによって最近行なわれたLaTeXについての方針変更の影響のようだった。
latex2html をあきらめ、emacsの上で自力で html に書き換えることにした。自力といっても、キーボードマクロや query-replace-regexp を多用することで、かなりの作業を自動化できた。とりあえず体裁が整った。
この時点で昼過ぎになってしまい昼食休憩。
午後は、chapter-section-subsectionなどのナンバリングを始めた。最初はCSSのcounterを使ってみたのだが、僕のブラウザ(Mozilla 1.7 on FreeBSD)では全く動作しない。いろいろ試しているうちに1時間。あきらめてマニュアルでナンバーを打つことにした。htmlファイルのウインドウを2バッファに分割し、latexのauxファイルを片方に読み込み、section関係の行だけを残してから番号とタイトルだけを残して後は(ほぼキーボードマクロで)消した。次に、章タイトルなどをauxファイルだったバッファから読みだして、それをhtmlのバッファで search-forward-string で捜し出し、auxファイルから番号を切り出してペースとするという作業だ。このほとんどの作業はキーボードマクロでできた。
そして最後の難関は画像ファイルの導入と、表・画像番号のreferenceの反映だ。ここで、目の前のディスプレイは Mozilla 1.7 on FreeBSD なのだが、左側の iMac に Safari 1.1 を立ち上げ、さらに IE 5.0 for Mac も立ち上げる。右側の MS-XP でも IE 6.0 を立ち上げる。そして、div 関係のCSSを睨みながら、どのブラウザでも同じように見えるようにcssを書いていく。結果として、IE 5.0 for Mac では少し表示がずれてしまうが、割りと満足の行く位置に画像が出た。この辺りで html lint なども使い始め、95点以上となるように直しを入れた。
一つの画像が出ると残りの画像も同じように出せるはずなのだが、実は、元画像の形式は bmp, gif, jpeg, png とバラエティが広く、これを少しだけ統一しながら色などを落してサイズを小さくする。そして、referenceを直し終ったら、何時のまにか 20:45 だった。
悲しい。
最初から perl か何かで文書を作っておいて、一発で pLaTeX と html 両方のソースを生成するようにしておく方が効率的だったかも。
僕が尊敬する某N先生が日頃「他の人でもできる仕事で忙しくするのは避けるように」とアドバイスしておられるのを思い出した。今日の仕事はどうだったのかなぁと深く反省。
| 固定リンク
この記事へのコメントは終了しました。
コメント
Commented by 中西 at 2005-07-23 01:42
最初から両方用にと思ってればそれなりの原稿を作るんだろうけど,後からTeX→HTMLにするのって,HTML→TeXよりも面倒ですよね。
Commented by ttmtko at 2005-07-23 08:39
確かに、そういう一面もありますが、根本的なところを考え直してみたら、ロジカルにテキストを生成する言語を使えば済むってことかと思ったのです。例えば、番号なしリストを生成するときもHTMLソースを生成するかpLaTeXソースを生成するかを起動オプションで選んであげるようにプログラムを作ればいいのかなーって。こんな感じですかね。
if ( sw == 1 )
print "<!--#exec cmd=\"/bin/cat preamble.html\"-->";
else
print "\\input{mymacro.tex}";
とか。あるいは
if ( sw == 1 )
print "<body>";
else
print "\\begin{document}";
とか。
Commented by ttmtko at 2005-07-23 08:42
追記:内容が学術的なものではないから、余計にヘコムんですよ。
Commented by okumura at 2005-07-23 15:08
そういうときこそPDF!
Commented by ttmtko at 2005-07-23 16:04
えええ?
PDFを生で書くんですか?
Commented by 中西 at 2005-07-23 19:07
MS-DOS時代によく使われていたXTRみたいなテキストフォーマッタのイメージでしょうか。
Commented by ttmtko at 2005-07-24 14:31
う〜ん、XTR ですか。それをいうと、 nroff とかもありますねぇ。
個人的には、html と latex という2つのフォーマットのどちらの文書も
generateできる言語があると嬉しいなって思うんですけど。
一度内部で latex を走らせて、出来た aux などを利用してソソクサっと htmlを作って欲しいな。
脚注はポッポアップとかにして欲しいし、cssは後からいくらでも入れ換えられるようにして欲しいし、
数式は png で生成して欲しいし…。latex2htmlが進化すればいいのかなぁ。
あと、図表も自動で対応して欲しいなぁ。ってところなんです。
Commented by だきわ at 2005-07-28 10:06
BuildできないFreeBSDでないプラットフォームでlatex2htmlを使うって解決方法は駄目かしら?
Commented by ttmtko at 2005-07-29 14:13
>>だきわさん
それ(latex2html on Plamo Linux)も考えたのですが…急いでいたので、確実な方に走りました。
投稿: 中西, okumura, だきわ and me | 2005年10月 9日 (日) 10:43