新聞記事によるドイツ語コーパス構築
ドイツ語情報処理研究
24 (2014)
ICT (Information and Communication Technology) の発達により、個人がインターネット上から、「生の」データを入手して、コーパスを構築することが可能になった。本研究では、ドイツの週刊新聞「ディー・ツァイト」の記事を、ヘッドライン配信サービスRSSを介して収集し、コーパスとして利用可能な形に加工する手法を具体的に提示した。