Under Construction
先進的翻訳技術研究室では、インターネット上で公開されているテキストデータ(コーパス・データベース化されたものを含む)を取得し、自然言語処理、機械翻訳技術の研究開発のために利用します。テキストデータの利用目的として、入力テキスト中の固有表現を特定し、Wikipedia等の構造化データベースと紐づける固有表現の認識・曖昧性解消や、それを利用した機械翻訳の研究開発に利用することを想定しています。
データを収集するサイト: