[研究テーマ]Web上のテキストを用いて人々の感情やさまざまな情報を分析
「生き物」である言葉をWeb上のテキストデータから観察
「そんなつもりじゃなかったのに……」————SNSで友人などとやりとりする際、自分が使った言葉によって思わぬトラブルを招いたことはありませんか。 言葉は、前後の文脈によって、ニュアンスや意味が異なります。まさに、「言葉は生き物」といえるでしょう。Aの文脈ではこの意味だけど、Bの文脈だとまた違った意味になる……。Web上の膨大なテキストデータを基に、言葉について統計的に解析していくことが、この研究の面白いところです。言葉について自分が考えている意味と社会一般的な意味の相違や共通点など研究を通じて言葉の奥深い世界が見えてきます。
本研究室では、SNS情報で人々の感情、動きを読み取り、Twitterからコロナ渦の感情・トピック分析、映画レビューの感情分析、映画の⼝コミやメディア露出が興⾏収⼊に与える影響について、⾳楽の韻律パターンの分類など多様な研究に学生が取り組んでいます。
本研究室では、SNS情報で人々の感情、動きを読み取り、Twitterからコロナ渦の感情・トピック分析、映画レビューの感情分析、映画の⼝コミやメディア露出が興⾏収⼊に与える影響について、⾳楽の韻律パターンの分類など多様な研究に学生が取り組んでいます。
自然言語処理技術でWeb上のテキストから人々の感情を分析
自然言語処理とは人間の言葉をコンピュータに理解・処理させる技術であり、Appleの「Siri」や話題の「ChatGPT」でも使われています。この手法を活用して、Web上のテキストから人々の感情や世間の評判などの分析、予測ができます。これまで、今流行っている楽曲の歌詞や、YouTubeの音楽動画に投稿されるコメントを分析して多用される言葉を可視化するWebアプリの開発や、コロナ禍におけるSNSの投稿から感情を分析する研究を行ってきました。Web上の情報を深く分析すれば、どのような反響が返ってくるのか予想することもできます。SNSで炎上する前にAIで一度チェックしてからコメントを投稿するといった作業が当たり前になるかもしれません。
言語処理を活用して医療人材不足に貢献
近年、看護師や介護福祉士など医療に従事する人材不足が問題となっています。そのため、政府は海外から人材を招き入れる政策を展開しているところですが、その障がいとなっているのが言葉の問題です。例えばインドネシアからも看護師候補者を招いていますが、同国は非漢字圏。日本の医療用語は漢字の専門用語が非常に多く、それが原因で試験に合格できずに母国に帰国するようなことがあれば大変な損失です。言葉の問題を解消するため、必ず学ぶべき基本的な医療用語について、理解を手助けする研究を進めています。医療用語は複数の用語から成り立っているため、その構成要素に意味属性(身体の部位、病気の症状、病名など)を付与したり、難易度を設定することで難易度順に効率的に学習するなどの仕組みを検討しています。膨大なデータ(ビッグデータ)を分析・学習し、問題解決に必要な情報を提案する仕組みが医療現場の人材不足を解消に導きます。