【専攻領域 Research interests】コーパス文体論,文体統計学,コーパス言語学,フィロロジー:18,19世紀の英語散文コーパス編纂;機械可読テキストを利用したDickensの言語・文体研究;著者推定法;テクスト類型論など.
Associate Professor Tabata's research interests are in humanities computing (including statistical study of text typology & register variation ), 'corpus stylistics' and testing of disputed authorship. He is currently working on his word-class tagged Dickens corpus, upon which he plans to conduct a longitudinal study of Dickens's style. Part of his research project has been carried out with the Grant-in-Aid for Scientific Research from the JSPS, 1998--2010.
"the", "of", "and", "in", "to" . .. などの機能語を中心とした語彙はいかなるジャンルの英文においても極めて高い頻度で生起しており,これら上位30語だけでテクストの総語数の約40%を占めているが,通常の言語行為(読む・聞く・書く)において,われわれがこれらの語の生起頻度を意識することはあまりないと言ってよいであろう。ところが,このように一見文法的な機能や役割しか有していないように思われる語彙も,それらを30語,50語,100語といった具合にセットとしてその「生起パターン」を統計解析してみると,文体論的に興味深い事実が観察できる。たとえば,様々なテクスト・ジャンル間の言語変異 (register variation),英語散文の文体の史的推移 (stylistic shifts across centuries),著者の推定 (authorship attribution),特定の作家の経年的文体変化 (chronological variation of style) などを割り出すことが可能である。(*Diagramsの項目に成果の一部をグラフとして掲載)
個人プロジェクト(科学研究費補助金助成研究)平成10–11年度,および平成12–13年度の(日本学術振興会)科学研究費助成を受け,ディケンズ (1812-70) の小説全作品の電子化を完了し、テクスト中の全単語に品詞標識を付与する作業を行った。これを基にディケンズの作品の文体統計論的解析を進め,語彙・構文等,言語項目間の相互関係や,サンプル(テクスト)間の相互関係,さらには言語項目とテキストとの相互関係を浮き彫りにし,ディケンズの文体(特に語彙構造,文構造の年代的推移)を量的観点から記述することを当面の課題としている。また,平成14–16年度,平成17–19年度の科学研究費助成研究では,18世紀から20世紀にかけての近代英語散文の動態を文体統計論的視点から考察する計画である。
言語文化研究科共同研究プロジェクト:大阪大学言語文化部・大学院言語文化研究科で2000年にスタートした研究企画。2001年から岩根久教授・緒方典裕助教授と共に「電子化言語資料分析の方法論」というプロジェクトを二年間おこなった。2003年度からは本研究科の大学院生も加わり、「電子化言語資料分析研究」と名称変更した。プロジェクトの成果報告書のコンテンツは以下の通り:
『電子化言語資料分析の方法論』2002年3月発行
・岩 根 久 「フランス詩脚韻資料作成のテクニック」
・緒 方 典 裕 「ダイナミック・セマンティクス,XMLプログラミング,情報抽出」
・田 畑 智 司 「英語文体論研究のための言語処理技術ー Corpus Processing for Stylistic Analysis of Textsー」
『電子化言語資料分析の方法論II』2003年4月発行
・岩 根 久 「階層的クラスター分析の有効性ー英・仏・独・伊・西語の文字連鎖出現率の分析ー」
・Norihiro Ogata "Web Contents as Ontological Resources of Semantic Web"
・田 畑 智 司 「Browsing through the BNC with BNCwebーBNCwebによるBNC検索ー」
『電子化言語資料分析研究』2004年5月発行
・田 畑 智 司 「プロジェクトの目的と活動」
・岩 根 久 「統計処理言語Rを用いた対応分析のテクニック—英・仏・独・伊・西語の文字連鎖出現率の分析—」
・石 部 尚 登 「ベルギーの新聞記事に見る「ことば観」—固有名詞としてのことばの名称が持つイメージ—」
・Norihiro Ogata "The Ontology of Linguistic Syntactic Categories"
・後 藤 一 章 「BNCとWeb検索を利用したteenagerとyoungsterの分析」
・松 本 敬 子 「BNCwebを用いた味覚の様態—ly副詞の考察:共感覚表現のネットワーク」
・田 畑 智 司 「—ly副詞の生起頻度解析による文体識別—コレスポンデンス分析と主成分分析による比較研究— 」
『電子化言語資料分析研究2004-2005』 2005年5月発行
・田 畑 智 司 「プロジェクトの目的と活動」
・紙 谷 一 彦 「BNCにおけるbody形,one形不定代名詞の分布と共起語」
・岩 根 久 「統計処理言語Rを用いたテキストデータ加工のテクニック—フランス詩音韻構造データ作成のために—」
・大 前 智 美 「ドイツ語構文解析の試み—名詞と形容詞のタイプ分けについて—」
・後 藤 一 章 「英語コロケーションの抽出に関するMachinese SyntaxとLink Grammar Parserの比較研究」
・Naoto ISHIBE «Belgicismes: critères de distinction et corrélation avec la classe sociale»
・Norihiro Ogata "The Event Culculus in the Semantic Web "
・Tomoji Tabata "Stylistics of —ly adverbs in Dickens and Smollett: A quantitative study by means of correspondence analysis"
『電子化言語資料分析研究2005-2006』 2006年5月発行
・田 畑 智 司 「プロジェクトの目的と活動」
・後 藤 一 章 「学術英語コーパスにおけるSV表現抽出の試み—Corpus Based EAP Learning へ向けて—」
・岩 根 久「 統計処理言語Rを用いたテキストデータ加工のテクニック2—日本語Windows環境でのフランス語テキスト処理—」
・紙 谷 一 彦「 書き言葉と話し言葉における body形, one形不定代名詞の共起語の違い」
・石 部 尚 登「 差異を計る尺度としての対数尤度比の利用 ―複数のキーワード 間の関係を探るために―」
・藤 原 康 弘 「日本人英語使用者コーパス編纂プロジェクト—Japanese User Corpus of English: JUCE—」
・田 畑 智 司 「米国歴代大統領就任演説の言語を計る—多変量アプローチによるテキスト類型化試論—」
・Norihiro OGATA "A Non-Monotonic Deductive Learning of Domain-Specific Ontologies from Domain-Specific Texts"
電子化言語資料分析研究2006-2007
新メンバーが加わり,教員5名,院生5名の計10名で共同研究プロジェクトを推進する予定。(研究代表者:田畑 智司,研究分担者:岩根 久,岩居 弘樹,緒方 典裕,大前 智美,石部 尚登,後藤 一章,紙谷 一彦,藤原 康弘,北本 徹平)
大阪大学・トゥルク大学 (Finland) 学術交流協定に基づくOsaka-Turku共同プロジェクト。今井光規名誉教授とRisto Hiltunen教授の交流を源に立ち上げられた。2004年2月に大阪大学出版会より共同執筆論集 Approaches to Style and Discourse in English (Risto Hiltunen, 渡部眞一郎編)を刊行。Approaches to Style and Discourse in Englishのコンテンツは次の通り:
・Risto Hiltunen, SALEM, 1692: A CASE OF COURTROOM DISCOURSE IN A HISTORICAL PERSPECTIVEは
・Mitsunori Imai, REPETITION IN MIDDLE ENGLISH METRICAL ROMANCES
・Matti Peikola, INDIVIDUAL VOICE IN LOLLARD DISCOURSE
・Tomoji Tabata, DIFFERENTIATION OF IDIOLECTS IN FICTIONAL DISCOURSE: A STYLO-STATISTICAL APPROACH TO DICKENS'S ARTISTRY
・Ellen Valle, 'A nice and accurate philosopher': INTERACTIVITY AND EVALUATION IN A HISTORICAL CORPUS OF SCIENTIFIC WRITING
・Hideki Watanabe, TEXTUAL SIGNIFICANCE OF THE SENTENCES IN THE FORM OF þat wæs god cyning IN OLD ENGLISH POEMS
・Marita Gustafsson, SIMPLIFICATION OF SPECIAL LANGUAGE: A CASE STUDY ON STANDARD MARINE COMMUNICATION PHRASES
・Ayako Omori, A MENTAL ACTIVITY IS A FLOW OF WATER: POETIC METAPHOR AND COGNITION
・Paivi Pietila, CONVERSATIONAL SKILLS AND DISCOURSE STRATEGIES IN A FOREIGN LANGUAGE
・Aoi Tsuda, PERSUASIVE DISCOURSE: HOMILETICS ON EASTER IN JAPANESE AND AMERICAN CATHOLIC SPEECH COMMUNITIES
・Shinichiro Watanabe, RHYMING SLANG: ITS LEXICAL AND GRAMMATICAL FEATURES
・Gerry Yokota, IN OTHER WORDS: LANGUAGES OF TERROR, LANGUAGES OF PEACE
Dickens Lexicon編纂プロジェクト: 故山本忠雄博士の遺品として残っていた用例カードを基に山本博士が構想されていたDickens Lexiconを電子媒体(CD-ROM/DVD-ROM)で実現するために熊本および広島のメンバーを中心に鋭意作業中。Link to "Dicken Lexicon 編纂室(編纂関係者しかアクセスできません)。
所属学会:International Association of University Professors of English (IAUPE), Association for Literary and Linguistic Computing, The Association for Computers and the Humanities, 近代英語協会, 英語コーパス学会, The Dickens Society
学会等における活動:英語コーパス学会運営委員 (1995-), 英語コーパス学会機関誌『英語コーパス研究』編集委員長 (1996-1998), Revue, Informatique et Statistique dans les Sciences Humaines (RISSH) 編集委員 (1994 ̄), 英語コーパス学会10周年記念論集 English Corpora under Japanese Eyes: JAECS Anthology Commemorating its 10th Anniversary編集委員
Fig. 1 Christmas Booksの会話部の頻度上位60語にみるイディオレクトの描き分け:イディオレクトの相互関係 (Submissive temperament (left) vs. Dominant personalities (right); Highly interpersonal style (top) vs. Highly non-interpersonal, disquisitory style (bottom). Cf. Fig. 2. (Tabata, 2004)
Fig. 2 高頻度上位60語にみるイディオレクトの描き分け:60語の相互関係 (Tabata, 2004)
Fig. 3 高頻度語における男女のイディオレクトの描き分け(Tabata, 2004)
Fig. 4 Dickens in four decades: 作家としてのキャリアと文体の変化 (Tabata, 2002)
Fig. 5 DickensとSmollettの文体の相違:—ly副詞1245タイプの分布を基に。cf. Fig. 6 (ACH/ALLC 2005 発表資料)
Fig. 6 DickensとSmollettにおける—ly副詞の宇宙 (ACH/ALLC 2005 発表資料)
Figures 7-9 DickensにBiber & Finegan (1989)のMulti-Feature/Multi-Dimensional approach (MF/MD法・多項目多次元法)を適用した。Biber & Fineganによる三つのジャンルの近代英語散文(essay, fiction, letter)の通時研究の結果をベンチマークとして、言語変異の三つの次元それぞれにおけるDickensの位置づけを表したもの。 Dimension A = Informational vs. Involved production; Dimension B = Elaborated vs. Situation-Dependent reference; Dimension C = Abstract vs. Non-Abstract style (田畑2002)
【出版物】
Tabata, T. (1994) Dickens's Narrative Style: A Statistical Approach to Chronological Variation. Revue, Informatique et Statistique dans les Sciences Humaines (RISSH, Centre Informatique de Philosophie et Lettres, Universite de Liege, Belgique), 30 (1994), 165-182.
Tabata, T. (1995) Narrative Style and the Frequencies of Very Common Words: A Corpus-Based Approach to Dickens's first person and third person narratives. English Corpus Studies, 2 (1995), 91-109. (Adobe Acrobat Reader(フリー)が必要. ダウンロードサイトはこちら)
田畑 智司 (1998)「コーパスに基づく文体論の研究〜計量文体論を中心に」(『英語コーパス言語学:基礎と実践』第9章 研究社出版)
田畑 智司 他共訳 (1999)『ロデリック・ランダムの冒険』(荒竹出版)1999年12月10日 (原著 Tobias Smollett, The Adventures of Roderick Random (1748))
田畑 智司(編)(2002)『電子化言語資料分析の方法論』言語文化共同研究プロジェクト2001. 大阪大学言語文化部・大阪大学大学院言語文化研究科 (2002年3月).
田畑 智司 (2002)「Corpus-Based Stylistics--MF/MD法による文体比較--」, 渡辺 秀樹(編)『英語文体論の方法と射程』言語文化共同研究プロジェクト2001. 大阪大学言語文化部・大阪大学大学院言語文化研究科 (2002年3月). 75-89.
田畑 智司 (2002)「英語文体論研究のための言語処理技術--Corpus Processing for Stylistic Analysis of Texts--」, 田畑 智司(編)『電子化言語資料分析の方法論』. 25-39.
Tabata, T. (2002) Investigating Stylistic Variation in Dickens through Correspondence Analysis of Word-Class Distribution, in T. Saito et al (eds.) English Corpus Linguistics in Japan. Amsterdam: Rodopi (2002), 165-182.
田畑 智司 (2003)「コーパスとテクスト」『英語コーパス研究』第10号.
Tabata, T. (2003) Assessing Multivariate Techniques in Studies of Stylistic variation in Tetxs: Cross-Examination of Principal Component Analysis and Correspondence Analysis. 科学研究費補助金基盤研究(C)研究成果報告書
田畑 智司 (2003) 「Dickensにおける--ly副詞の分布ー計量分析序説ー」大森 文子(編)『レトリック研究の方法と射程』言語文化共同研究プロジェクト2002. 大阪大学言語文化部・大阪大学大学院言語文化研究科 (2003年4月).
田畑 智司 (2003) 「Browsing through the BNC with BNCweb」緒方 典裕(編)『電子化言語資料分析の方法論 II』言語文化共同研究プロジェクト2002. 大阪大学言語文化部・大阪大学大学院言語文化研究科 (2003年4月)
Tabata, T. (2004) Differentiation of Idiolects in Fictional Discourse: A Stylo-Statistical Approach to Dickens's Artistry, in R. Hiltunen and S. Watanabe (eds.) Approaches to Style and Discourse in English. Osaka: Osaka UP. 79-106.
田畑 智司(編) (2004) 『電子化言語資料分析研究』言語文化共同研究プロジェクト2003. 大阪大学言語文化部・大阪大学大学院言語文化研究科 (2004年5月)
田畑 智司 (2004) 「--ly副詞の生起頻度解析による文体識別—コレスポンデンス分析と主成分分析による比較研究—」田畑 智司(編)『電子化言語資料分析研究』言語文化共同研究プロジェクト2003. 大阪大学言語文化部・大阪大学大学院言語文化研究科 (2004年5月)
Nakamura, J., Inoue, N., and Tabata, T. (2004) (eds.) English Corpora under Japanese Eyes. Amsterdam: Editions Rodopi.
田畑 智司 (2005) 「コーパスに基づく文体論研究」齊藤 俊雄,中村 純作,赤野 一郎(編)『英語コーパス言語学:基礎と実践 改訂新版』研究社
田畑 智司(編) (2005) 『電子化言語資料分析研究2004–2005』言語文化共同研究プロジェクト2004. 大阪大学大学院言語文化研究科 (2005年5月)
Tabata, T. (2005) Stylistics of —ly adverbs in Dickens and Smollett: A quantitative study by means of correspondence analysis 田畑 智司(編)『電子化言語資料分析研究2004-2005』言語文化共同研究プロジェクト2004 大阪大学大学院言語文化研究科 (2005年5月)
Tabata, T. (2005) Profiling stylistic variations in Dickens and Smollett through correspondence analysis of low frequency words, in ACH/ALLC 2005 Conference Abstracts, Humanities Computing and Media Centre, University of Victoria, Canada.
【学会シンポジウム発表・講演等 Conference papers/Symposia】
「欧州のコーパス言語学」大阪大学・コペンハーゲン大学学術交流プログラム記念シンポジウム『言語研究の現在』 平成10年7月12日 大阪大学大学院言語文化研究科
「コンピュータでディケンズの英語を計るー高頻度語の生起パターンと文体変異ー」白馬言語学会第30回大会記念シンポジウム 平成10年8月21日
「コンピュータを利用した文学作品の言語研究ー Dickens の小説と高頻度語の生起パターンー」日本英文学会中部支部第50回大会シンポジアム『コンピュータと英語英文学研究』平成10年10月 名古屋大学
「ディケンズの言語の諸相:語彙の生起パターンと文体のヴァリエイション」日本英文学会第71回大会シンポジアム『電子テキスト時代のフィロロジー』平成11年5月30日 松山大学
「ディケンズの言語の諸相:語彙範疇の生起パターンと言語変異」近代英語協会第17回大会シンポジウム『18,19世紀イギリス小説の言語と文体』平成12年5月19日 鶴見大学
「コンピュータで英語を計る:コーパス言語学の世界」大阪外国語大学公開講座 平成12年6月16
「コーパスとテキスト」英語コーパス学会第20回大会 英語コーパス学会10周年記念シンポジウム『日本における英語コーパス言語学の現状と展望』平成14年10月5日 名古屋大学大学院国際開発研究科(発表資料<スライド(PDF書類)>のダウンロードはこちらから)
「コーパスに基づく量的アプローチ」近代英語協会第20回大会 近代英語協会20周年記念シンポジウム『21世紀の英語史研究』平成15年5月23日 東京外国語大学
'Stylo-statistical Approach to —ly Adverbs in Fiction: A Comparative Study of Dickens and Smollett'. IAUPE (International Association of University Professors of English)19th Triennial Conference--August 8 to 14, 2004 Vancouver, Canada, Section 3: LINGUISTICS AND LITERATURE. 平成16年8月8〜14日.ブリティッシュ・コロンビア大学(カナダ)
英語コーパス学会第24回大会ワークショップ「コーパス言語学のための多変量解析入門」平成16年10月2日.大会資料はこちらから
'Profiling stylistic variations in Dickens and Smollett through correspondence analysis of —ly adverbs'. PALA Japan 2005 平成17年5月21日 東京大学
'Profiling stylistic variations in Dickens and Smollett through correspondence analysis of low frequency words'. ACH/ALLC 2005: The 17th Joint International Conference of the Association for Computers and the Humanities and Association for Literary and Linguistic Computing. Victoria, BC, Canada 15-18 June, 2005. Conference Abstractsはこちらから. 当日配布した資料はこちらからダウンロード可能 スライド(QuickTimeムービー) スライド(PDF)
「コーパス文体論」日本英文学会 九州支部第58回大会シンポジアム『これからの文体論:コーパス,文学,教育』平成17年10月29日 長崎大学
「文体への統計学的アプローチ」統計数理研究所 2005年度共同利用研究グループ公開セミナー『英語研究と統計』平成18年3月28日 統計数理研究所
「米国歴代大統領就任演説の言語を計る —多変量文体分析モデルによる演説テキストの類型化—」文理融合研究会 Art-Handai 平成18年4月26日 大阪大学基礎工学部
'Linguistic variations in the Inaugural Addresses of U.S. Presidents —a pilot study in corpus stylistics—'. The 27th International Conference of the Poetics and Linguistics Association (PALA 2006). Joensuu, Finland 25-31 July, 2006.
* This website is optimised for Safari 2.0 on Mac OS X 10.4 "Tiger". Fonts used in this page are: Gill Sans, Times New Roman, and ヒラギノ角ゴシック.
Copyright © 1996-2006 by Tomoji Tabata. All Rights Reserved.