(Encoded in UTF-8) Updated: Tuesday, 12/12/06

Welcome to the Department of Language Technology (DLT), the Graduate School of Language and Culture, the University of Osaka. The DLT is dedicated to Corpus-driven Research on the English and other languages. 大阪大学大学院言語文化研究科,応用言語技術論講座では電子コーパスに基づく言語研究を推進しています。電子コーパスや情報処理技術,統計学を駆使した言語研究に強い関心を持つ大学院進学希望の方々を歓迎します。学生募集要項はこちらから:大学院博士前期課程後期課程

大阪大学大学院・言語文化研究科・応用言語技術講座では大規模電子化コーパスの編纂に関わる研究,およびコーパスに基づく言語研究を行っています。総語数一億語からなる British National Corpus をはじめ,現代英語コーパスの先駆となった Brown Corpus, その英国英語版の Lancaster-Oslo/Bergen (LOB) Corpus, 古英語から初期近代英語までをカバーしている通時的言語資料 Helsinki Corpus,さらには現代英語の地域変種コーパスの Australian Corpus of English, Wellington Corpus (New Zealand), Kolhapur Corpus (India), Frown (US), FLOB (GB),口語英語を収録した London-Lund Corpusやロンドンの若者言葉をサンプリングしたCOLTなど,既存の各種コーパス(詳細はResourcesのページを参照)を取り揃える一方,18世紀〜19世紀の近代英語散文のコーパス編纂,Charles DickensやTobias Smollettなど,特定作家の作品を網羅した 'canonical corpora' の編纂も行っています。

こうした電子コーパスから得られた言語データは,主に多変量解析の手法を用いて分析され,言語使用の様々なパターンを浮き彫りにしています。大規模な電子コーパスから得られる知見には,従来の手作業による調査法や研究者の内省と限られた経験だけでは発見が極めて困難でであった言語事実も多く含まれます。

電子化言語資料論における主な研究テーマとしては,使用域による言語変異,特定作家の文体,およびその年代的変化,著者推定法に関わる研究などです(詳細はResearchのページを参照)。

【キーワード Keywords】 authorship attribution, British National Corpus (BNC), BNCweb, collocation, concordance, corpus/corpora, corpus linguistics, corpus stylistics, correspondence analysis, Dickens, electronic texts/e-texts, humanities computing (computational analysis of texts), multivariate statistics, principal component analysis, register variation, style/stylistics, stylometry

* This website is optimised for Safari 2.0 on Mac OS X 10.4 "Tiger". Fonts used in this page include: Gill Sans, Times New Roman, and ヒラギノ角ゴシック.

大阪大学大学院・言語文化研究科・田畑 智司

Copyright © 1996-2005 by Tomoji Tabata. All Rights Reserved.