Encoded in UTF-8 (Updated: Friday, 29/09/06 )

大阪大学大学院・言語文化研究科・田畑 智司

【専攻領域 Research interests】コーパス文体論,文体統計学,コーパス言語学,フィロロジー:18,19世紀の英語散文コーパス編纂;機械可読テキストを利用したDickensの言語・文体研究;著者推定法;テクスト類型論など.

Associate Professor Tabata's research interests are in humanities computing (including statistical study of text typology & register variation ), 'corpus stylistics' and testing of disputed authorship. He is currently working on his word-class tagged Dickens corpus, upon which he plans to conduct a longitudinal study of Dickens's style. Part of his research project has been carried out with the Grant-in-Aid for Scientific Research from the JSPS, 1998--2010.

"the", "of", "and", "in", "to" . .. などの機能語を中心とした語彙はいかなるジャンルの英文においても極めて高い頻度で生起しており,これら上位30語だけでテクストの総語数の約40%を占めているが,通常の言語行為(読む・聞く・書く)において,われわれがこれらの語の生起頻度を意識することはあまりないと言ってよいであろう。ところが,このように一見文法的な機能や役割しか有していないように思われる語彙も,それらを30語,50語,100語といった具合にセットとしてその「生起パターン」を統計解析してみると,文体論的に興味深い事実が観察できる。たとえば,様々なテクスト・ジャンル間の言語変異 (register variation),英語散文の文体の史的推移 (stylistic shifts across centuries),著者の推定 (authorship attribution),特定の作家の経年的文体変化 (chronological variation of style) などを割り出すことが可能である。(*Diagramsの項目に成果の一部をグラフとして掲載)

個人プロジェクト(科学研究費補助金助成研究)平成10–11年度,および平成12–13年度の(日本学術振興会)科学研究費助成を受け,ディケンズ (1812-70) の小説全作品の電子化を完了し、テクスト中の全単語に品詞標識を付与する作業を行った。これを基にディケンズの作品の文体統計論的解析を進め,語彙・構文等,言語項目間の相互関係や,サンプル(テクスト)間の相互関係,さらには言語項目とテキストとの相互関係を浮き彫りにし,ディケンズの文体(特に語彙構造,文構造の年代的推移)を量的観点から記述することを当面の課題としている。また,平成14–16年度,平成17–19年度の科学研究費助成研究では,18世紀から20世紀にかけての近代英語散文の動態を文体統計論的視点から考察する計画である。

言語文化研究科共同研究プロジェクト:大阪大学言語文化部・大学院言語文化研究科で2000年にスタートした研究企画。2001年から岩根久教授・緒方典裕助教授と共に「電子化言語資料分析の方法論」というプロジェクトを二年間おこなった。2003年度からは本研究科の大学院生も加わり、「電子化言語資料分析研究」と名称変更した。プロジェクトの成果報告書のコンテンツは以下の通り:

『電子化言語資料分析の方法論』2002年3月発行

・岩 根   久 「フランス詩脚韻資料作成のテクニック」
・緒 方 典 裕 「ダイナミック・セマンティクス,XMLプログラミング,情報抽出」
・田 畑 智 司 「英語文体論研究のための言語処理技術ー Corpus Processing for Stylistic Analysis of Textsー」

『電子化言語資料分析の方法論II』2003年4月発行

・岩 根   久 「階層的クラスター分析の有効性ー英・仏・独・伊・西語の文字連鎖出現率の分析ー」
・Norihiro Ogata "Web Contents as Ontological Resources of Semantic Web"
・田 畑 智 司 「Browsing through the BNC with BNCwebーBNCwebによるBNC検索ー」

『電子化言語資料分析研究』2004年5月発行

・田 畑 智 司 「プロジェクトの目的と活動」
・岩 根   久 「統計処理言語Rを用いた対応分析のテクニック—英・仏・独・伊・西語の文字連鎖出現率の分析—」
・石 部 尚 登 「ベルギーの新聞記事に見る「ことば観」—固有名詞としてのことばの名称が持つイメージ—」
・Norihiro Ogata "The Ontology of Linguistic Syntactic Categories"
・後 藤 一 章 「BNCとWeb検索を利用したteenagerとyoungsterの分析」
・松 本 敬 子 「BNCwebを用いた味覚の様態—ly副詞の考察:共感覚表現のネットワーク」
・田 畑 智 司 「—ly副詞の生起頻度解析による文体識別—コレスポンデンス分析と主成分分析による比較研究— 」

『電子化言語資料分析研究2004-2005』 2005年5月発行

・田 畑 智 司 「プロジェクトの目的と活動」
・紙 谷 一 彦 「BNCにおけるbody形,one形不定代名詞の分布と共起語」
・岩 根   久 「統計処理言語Rを用いたテキストデータ加工のテクニック—フランス詩音韻構造データ作成のために—」
・大 前 智 美 「ドイツ語構文解析の試み—名詞と形容詞のタイプ分けについて—」
・後 藤 一 章 「英語コロケーションの抽出に関するMachinese SyntaxとLink Grammar Parserの比較研究」
・Naoto ISHIBE «Belgicismes: critères de distinction et corrélation avec la classe sociale»
・Norihiro Ogata "The Event Culculus in the Semantic Web "
・Tomoji Tabata "Stylistics of —ly adverbs in Dickens and Smollett: A quantitative study by means of correspondence analysis"

『電子化言語資料分析研究2005-2006』 2006年5月発行

・田 畑 智 司 「プロジェクトの目的と活動」
・後 藤 一 章 「学術英語コーパスにおけるSV表現抽出の試み—Corpus Based EAP Learning へ向けて—」
・岩 根   久「 統計処理言語Rを用いたテキストデータ加工のテクニック2—日本語Windows環境でのフランス語テキスト処理—」
・紙 谷 一 彦「 書き言葉と話し言葉における body形, one形不定代名詞の共起語の違い」
・石 部 尚 登「 差異を計る尺度としての対数尤度比の利用 ―複数のキーワード 間の関係を探るために―」
・藤 原 康 弘 「日本人英語使用者コーパス編纂プロジェクト—Japanese User Corpus of English: JUCE—」
・田 畑 智 司 「米国歴代大統領就任演説の言語を計る—多変量アプローチによるテキスト類型化試論—」
・Norihiro OGATA "A Non-Monotonic Deductive Learning of Domain-Specific Ontologies from Domain-Specific Texts"

電子化言語資料分析研究2006-2007

新メンバーが加わり,教員5名,院生5名の計10名で共同研究プロジェクトを推進する予定。(研究代表者:田畑 智司,研究分担者:岩根  久,岩居 弘樹,緒方 典裕,大前 智美,石部 尚登,後藤 一章,紙谷 一彦,藤原 康弘,北本 徹平)

大阪大学・トゥルク大学 (Finland) 学術交流協定に基づくOsaka-Turku共同プロジェクト。今井光規名誉教授とRisto Hiltunen教授の交流を源に立ち上げられた。2004年2月に大阪大学出版会より共同執筆論集 Approaches to Style and Discourse in English (Risto Hiltunen, 渡部眞一郎編)を刊行。Approaches to Style and Discourse in Englishのコンテンツは次の通り:

・Risto Hiltunen, SALEM, 1692: A CASE OF COURTROOM DISCOURSE IN A HISTORICAL PERSPECTIVEは
・Mitsunori Imai, REPETITION IN MIDDLE ENGLISH METRICAL ROMANCES
・Matti Peikola, INDIVIDUAL VOICE IN LOLLARD DISCOURSE
・Tomoji Tabata, DIFFERENTIATION OF IDIOLECTS IN FICTIONAL DISCOURSE: A STYLO-STATISTICAL APPROACH TO DICKENS'S ARTISTRY
・Ellen Valle, 'A nice and accurate philosopher': INTERACTIVITY AND EVALUATION IN A HISTORICAL CORPUS OF SCIENTIFIC WRITING
・Hideki Watanabe, TEXTUAL SIGNIFICANCE OF THE SENTENCES IN THE FORM OF þat wæs god cyning IN OLD ENGLISH POEMS
・Marita Gustafsson, SIMPLIFICATION OF SPECIAL LANGUAGE: A CASE STUDY ON STANDARD MARINE COMMUNICATION PHRASES
・Ayako Omori, A MENTAL ACTIVITY IS A FLOW OF WATER: POETIC METAPHOR AND COGNITION
・Paivi Pietila, CONVERSATIONAL SKILLS AND DISCOURSE STRATEGIES IN A FOREIGN LANGUAGE
・Aoi Tsuda, PERSUASIVE DISCOURSE: HOMILETICS ON EASTER IN JAPANESE AND AMERICAN CATHOLIC SPEECH COMMUNITIES
・Shinichiro Watanabe, RHYMING SLANG: ITS LEXICAL AND GRAMMATICAL FEATURES
・Gerry Yokota, IN OTHER WORDS: LANGUAGES OF TERROR, LANGUAGES OF PEACE

Dickens Lexicon編纂プロジェクト: 故山本忠雄博士の遺品として残っていた用例カードを基に山本博士が構想されていたDickens Lexiconを電子媒体(CD-ROM/DVD-ROM)で実現するために熊本および広島のメンバーを中心に鋭意作業中。Link to "Dicken Lexicon 編纂室(編纂関係者しかアクセスできません)。

 

所属学会:International Association of University Professors of English (IAUPE), Association for Literary and Linguistic Computing, The Association for Computers and the Humanities, 近代英語協会, 英語コーパス学会, The Dickens Society

学会等における活動:英語コーパス学会運営委員 (1995-), 英語コーパス学会機関誌『英語コーパス研究』編集委員長 (1996-1998), Revue, Informatique et Statistique dans les Sciences Humaines (RISSH)  編集委員 (1994 ̄), 英語コーパス学会10周年記念論集 English Corpora under Japanese Eyes: JAECS Anthology Commemorating its 10th Anniversary編集委員

 

 

Fig. 1 Christmas Booksの会話部の頻度上位60語にみるイディオレクトの描き分け:イディオレクトの相互関係 (Submissive temperament (left) vs. Dominant personalities (right); Highly interpersonal style (top) vs. Highly non-interpersonal, disquisitory style (bottom). Cf. Fig. 2. (Tabata, 2004)

Fig. 2 高頻度上位60語にみるイディオレクトの描き分け:60語の相互関係 (Tabata, 2004)

 

Fig. 3 高頻度語における男女のイディオレクトの描き分け(Tabata, 2004)

 

Fig. 4 Dickens in four decades: 作家としてのキャリアと文体の変化 (Tabata, 2002)

 

Fig. 5 DickensとSmollettの文体の相違:—ly副詞1245タイプの分布を基に。cf. Fig. 6 (ACH/ALLC 2005 発表資料)

Fig. 6 DickensとSmollettにおける—ly副詞の宇宙 (ACH/ALLC 2005 発表資料)

Figures 7-9 DickensにBiber & Finegan (1989)のMulti-Feature/Multi-Dimensional approach (MF/MD法・多項目多次元法)を適用した。Biber & Fineganによる三つのジャンルの近代英語散文(essay, fiction, letter)の通時研究の結果をベンチマークとして、言語変異の三つの次元それぞれにおけるDickensの位置づけを表したもの。 Dimension A = Informational vs. Involved production; Dimension B = Elaborated vs. Situation-Dependent reference; Dimension C = Abstract vs. Non-Abstract style (田畑2002)

 

 

【出版物】


【学会シンポジウム発表・講演等 Conference papers/Symposia】

* This website is optimised for Safari 2.0 on Mac OS X 10.4 "Tiger". Fonts used in this page are: Gill Sans, Times New Roman, and ヒラギノ角ゴシック.

Copyright © 1996-2006 by Tomoji Tabata. All Rights Reserved.