東洋学文献類目とCHINA3
2001.10.4
京都大学人文科学研究所
附属漢字情報研究センター 村田 康彦
1.「東洋学文献類目」(Annual Bibliography of Oriental
Studies)の概要
(1)内容
当センターが受け入れた主要な雑誌(和中朝欧文)に掲載された東洋学に関する 論文及び当センター所蔵の単行本を年次ごとに内容によって分類した索引。年刊。
なお単行本には書評論文の対象となっている図書も含む。
(2)沿革 1934 ~
「東洋史研究文献類目」
1961,1962 「東洋学研究文献類目」 ( 採録範囲・分類等に変遷あり)
1963 ~ 「東洋学文献類目」
(3)構成
1.採録誌一覧
2.本文
論文の部(和・中・朝鮮文編,欧文編)
単行本の部(和・中・朝鮮文編,欧文編)
3.著者索引
(4)採録範囲 中国、インドを中心とした東洋学(人文・社会科学)の範囲
東……朝鮮まで 日本は関連あるもののみ採る
南……東南アジア・南アジア(アフガニスタンからインドネシアまで)
西……中央アジア(カスピ海・ウラル山脈以東)
北……モンゴル,沿海州・シベリアの一部
東洋学との関連において取捨選択する
(5)分類 中国四部分類を基礎に独自にコード化された分類体系
(6)排列 同一分類内では原則として地域別時代順(「宗教」「学者」「群経」
及び「諸子」「現代文芸」「民族」「言語文字学」の一部を除く)
地域 全体→東アジア→東南アジア→南アジア→中央アジア→北アジア
2.東洋学文献類目の作成
1980年度版までは手作業(カード作成),1981年度版よりコンピュータ を利用
採録論文選択→分類→入力原稿作成→データ入力→校正→データベース作成→印刷
(1)採録論文選択→分類→入力原稿作成
1.採録対象雑誌の各論文について,採録範囲内のものを選択
2.採録論文毎にページ、分類などのコードを付与
コードは冊子体の各レコードの排列を決定する
主題分類($B)と地域・時代・事項等($C)
A.$Bに使用するコード 1門~18門(計約90項目)
B.$Cに使用するコード
地域コード(国別コード 考古学のみ中国国内省別コードも付与)
時代コード(王朝(中国・日本・朝鮮・インドのみ)・西暦年・世紀)
事項コード(一部の分類のみ:群経、諸子、現代作家、諸言語、中国少数
民族)
内容コード(発表形式による区分-論文・会議録など)
3.各論文の1ページ目(タイトルと著者が記載されている部分)にコードを記入 した紙をはさみコピー(入力原稿)
(2)データ入力
(3)データベース作成
電算化の経過
1981. 7~ 現状分析とフォーマットの決定
1981.10 データ採録開始(1981年度分より)
1981.12 入力作業開始
1982. 5 データベース化のための仕様書作成
1984. 3 1981年度版冊子体目録発行
1987.11 データベースCHINA3公開
1994. 3 TEXによる冊子体目録出力
2000.10 人文研サーバーによるサービス(WWW)開始
文字について
富士通の提供する日本語情報システム(JEF)を利用
冊子体の字体は繁体字に統一(データベース内では検索用に新字のフィールド も設けている)
外字の取り扱い
富士通拡張文字と利用者定義文字
|
区分 |
内容 |
JIS非漢字 JIS漢字 |
英数字など 第1水準,第2水準 |
拡張漢字 拡張非漢字 |
富士通選定漢字,特殊文字等
|
利用者定義
|
利用者が独自に作成する文字 (漢字、ハングル、音標符号付ローマ字等 最大約3000字) | |
|
(4)印刷
3.データベース「CHINA3」の現状
大型計算機センターで公開中。DBMSは富士通の「FAIRS」
現在のレコード数 論文 272,463件
近代史 29,387件
計 335,974件 (2001.2.27現在)
データベース更新は年2~3回(約15000件/年)
「近代史」について
中共党史資料,文史資料,複印報刊資料(中国近代史、現代史)などが採録対象。
データ量の関係で冊子体には収録されていない(分類コード、地域・時代コード($B,$C)は付与されていない)
(参考)大型計算機センターで公開中の人文科学研究所作成のデータベース
CHINA1(7,546件)
明代の科挙合格者名簿明代登科録データベース
CHINA2(21,129件)
李商隠の詩文集樊南文集(中国古典のテキストデータベース)
BESSHOU(21,898件)
近現代中国人の別名データベース
SOKAIYO(63,129件)
宋会要輯稿編年データベース
SOSHO(849件)
漢籍叢書国内所蔵目録データベース