[大川周明ネット - 大川周明先生著作電子化計画]

大川周明先生著作電子化計画 口上


【檄文】
 1957年に逝去なされた大川周明先生の著作の著作権は2007年末で切れました。そのせいか、いくつかの著作が文庫本などで復刊されていますが、まだまだその数が多くありませんし、せっかく復刊された著作もすぐに絶版ないし品切重版未定となってしまったものが多いのが現状です。
 いや、それより何より、著作権の切れた作家の著作は、青空文庫などで順次テキスト化されていますが、2010年6月12日現在1件も登録されていません。だいたい「著作権の消滅した作家名一覧【お】」にも記載されておりません。つまりはまるっきりのノーマークというわけです。これってあんまりじゃありませんか! まあそれでも、作業中 作家リスト:オには2010年6月12日現在、『清河八郎』(全集第4巻所収)があがっているので、やはり志のある方はいらっしゃるのだなとほっとしますが、これでは大川先生の著作が青空文庫に登録されるのはまだまだ先のようですね。
 それから、国立国会図書館近代デジタルライブラリーには、大川周明先生の著作が5件(2010年6月12日現在)登録されていますが、まだまだ少ないですし、ここはとても重たくて、閲覧する気がうせてしまいます(わざと操作しにくくしているのかしら)。
 要するに、人任せにしていてはいけないってことです。なかなかPDF化、テキスト化が進行しないなら、私たちの手でやってしまいましょう。

【ここを読んでるあなたの力をお貸しください】
 1962年に刊行された大川周明全集の内容を私が順次PDF化していきます。
 そしてそれぞれの著作をOCRにかけます。もちろんこれだけなら誤変換の嵐なのですが、とりあえず最小限の整形だけしてアップします。
 このPDFファイルを見ながら、このOCRかけたままテキストを修正してください。
 修正された結果はすぐ反映されます。同時に真理子にメールされますので、ちょこちょこと点検して最終確定します。
 テキストを壊してしまうのではないかと心配する必要はありません。もとのバックアップはとってあります。気にせずどんどん直してくたさい。愚か者の掲示板荒らしくんがごちょごちょ破壊していっても気にしません。

【作業の流れ】
  1. 各著作のPDFを右クリックして「対象をファイルに保存」でダウンロードしてください。
    そのままクリックして見てもいいのですが、ダウンロードしてお手元に置いたほうが快適です。パソコンの画面は横長なので、縦書きの本を読むときは左90度回転させて横倒しにして読むとページ全体が画面に入ります。もちろん活字も横倒しになっちゃいますが、1行1行スクロールさせながら読むよりはるかにラクです。ところがAdobe Readerは、ブラウザのアドインとして動作するときはページの回転メニューが出て来ないのです。メニューが出て来ないだけでなくキーボード操作(shift+ctrl+-)でも不可能です。ですからPDFをあなたのお手元に置いてAdobe Readerをブラウザを介せず単独起動させて読むほうがいいです。
  2. 各著作のOCRをクリックしてOCRにかけたままのテキストを表示させ、修正するページを選びます。
    ミスがほとんどないページはすでに誰かが修正した可能性が高いです。もちろんそういうページにもわずかに入力ミスがあるかもしれないので探していただくとうれしいのですが、それよりは誤変換の山となっているページを直したほうがいいでしょう。
    各ページには、ユーザの修正回数を表示するようにしておりますので、さしあたりはそれが0のところをお願いします。
  3. 「真理子未承認のユーザ最新修正を信頼するモード」と「真理子が承認したテキストのみを表示するモード」
    テキスト表示画面も修正画面も、「真理子未承認のユーザ最新修正を信頼するモード」「真理子が承認したテキストのみを表示するモード」の2つがあります。前者は性善説に立ってユーザの修正を信頼してさらに修正を加えます。後者はユーザの修正を無視して私がアップした状態から修正を始めるものです。
     通常は「真理子未承認のユーザ最新修正を信頼するモード」で結構です。しかし、掲示板荒らしの襲撃にあって大々的にテキストが破壊されてしまった場合は、「真理子が承認したテキストのみを表示するモード」がよい場合があります。
  4. テキストを入力したら、表示されている4桁の確認キーを入力して、送信をクリックしてください。
  5. お名前やメールアドレスは記入しなくてかまいませんが、両方記入してくれたら、ご返事をいたします。
  6. 念のためですが、掲示板荒らし対策で、あなたのIPアドレス(次に記載されているもの)がこちらに通知されます。
    (18.212.93.234)
    同じIPアドレスから悪意ある書き込みが連続した場合は、そのIPアドレスからの書き込みを禁止する措置をとります。
    現実にはロボット型の掲示板巡回&書き込みプログラムの標的にあった場合が多いかと思います。悪意ある荒らしくんより始末に終えませんわ。


【著作検索のしかた】
  1. アップされている大川先生の著作データについて、題目、初出、全集ページ、およびデータへのリンクを示しています。
    1. 題目で(→××)となっているものは、著作のタイトルがPDFデータやOCRデータのタイトルと異なるものです。全集では、いくつかの著作を一つにまとめている場合があります。たとえば『大学の根本精神』『漢民族と其文明』『儒教の政治思想』の3論文は、全集では『中国思想概説』というあたかも1本の論文であるかのようにして収録されています。PDFやOCRは原則として全集を底本にしているので、『中国思想概説』というタイトルで作成しています。そのような場合、『大学の根本精神(→中国思想概説)』という形で表示しています。必要となる論文がPDFの途中に入っていることも多いので、PDFを読むときは、全集ページに注意してページをくってください。
    2. 初出は「講演など<雑誌掲載<単行本化」という形で優先しました(あとのほうを優先)。たとえば雑誌掲載後に単行本化されたときなどは、単行本化された日付となっています。
    3. 年齢は数え年です。誕生日を考慮せず機械的に年-1886(生年)+1となっています。
  2. 表示は、「初出順」「全集順」「題目順(あいうえお順)」から選べます。
  3. 検索は、キーワードを入力してデータをしぼりこみます。
    1. キーワードをスペース(半角も全角も可)で区切って複数入力すると、そのすべてを含むものを表示します。
    2. 「.(ピリオド)」は任意の1文字にマッチします。ですからたとえば「4.歳」と入力すると、40歳代の著作のみにしぼることができます。
    3. 題目の読みがなも検索項目に入っているので、題目の読みをひらがなで入力すると、データを検索することができます。
      読みがなはすべて濁点をとりのぞき小さいかなを大きくした形で入っています。あなたの入力したキーワードはこちらで自動的にそのような形に変換しますので、入力の際に考慮することはありませんが、データを検索したあとに検索欄に表示されているキーワードはそのような形に変換されていますので注意してください。


【ここにあがったテキストやPDFの扱い】
 完全に著作権フリーです。あなたは真理子に一切無届で自由に転載したり加工したりすることができます。その際に私の名前を書く必要もありません。
 テキスト化が完了した著作は順次青空文庫に投稿します。その際は対青空文庫の責任者として私の名前を名乗るつもりですが、みなさんの努力を横取りしようというわけではありません。何でしたら青空文庫その他への投稿をあなたの名前でしていただいても結構です。そのほうが面倒な仕事から解放されますから。私はカネも要らなきゃ名誉も要りません。
 皆様におかれましても、カネも名誉も要らず滅私奉公、ただただ大川先生の著作の普及を願う修道士修道女の精神でお力を貸していただきてく思います。

2010年6月12日 真理子