はじめに2025年9月17~19日にアクトシティ浜松で開かれた第20回言語処理若手シンポジウム (YANS2025) に、Polaris.AIはプラチナスポンサーとして協賛し、参加してきました。弊社メンバはポスターセッションのある2,3日目に参加してきました。これはYANS2025の主にポスターセッションを社内メモとしてまとめたものです。プラチナスポンサーとして参加弊社は、YANS2025にプラチナスポンサーとして参加しました。今回のテーマであった「研究と実装をつなぐ自然言語処理」のとおり、アカデミア要素の強いものから社会実装を加味して検討されているものまで大変興味深いセッションが多くありました。また、2日間で多くの来場者の方々にブースに足を運んでいただき、研究者・企業エンジニア・学生の方々と、幅広く交流することができました。セッションレポート (ポスター発表より抜粋)ポスター発表のテーマ別件数 (上位5位):LLM応用 (103件)LLM分析 (46件)マルチモーダル (46件)評価品質・品質推定 (38件)言語資源・アノテーション (35件)LLM応用が103件とポスター発表のかなりの割合を占めており、応用面への注目度の高さが伺えました。[S1-P45] GRPOを用いた日本語ラップの歌詞生成モデルの構築要点: LLMで韻を踏んだ歌詞を複数生成し、それぞれに報酬を与え、Group Relative Policy Optimization(GRPO)で学習韻を踏んだ日本語ラップ歌詞を生成手法: Sarashina2-7Bに対し、末尾の母音の類似度を報酬として与える課題: 韻の報酬は上昇したが、小節末尾で同じ言葉を繰り返す報酬ハックが発生 (例: ~未来)今後: 日本語ラップ歌詞生成からラップ音楽生成へ[S2-P25] RAGの検索評価の頑健性検証要点: JMTEBベンチマークと実データの相関を4モデル×8データセットで検証結果: NLP論文誌(0.871)とMLDR(0.795)は高相関、JaGovFAQは無相関考察: 簡単すぎるデータセットはベンチマーク機能が低下、埋め込みモデルの高精度化に合わせた難化が必要実務への示唆: プロダクトの品質を評価するためには、それに沿ったアカデミアベンチマークが必要という視点[S2-P28] 回路生成におけるLLMの推論能力獲得要点: 多目的強化学習で回路のパレート最適解を網羅的に生成先行研究: CodeV-R1とChipSeek-R1は単一最適解のみ結果: 電力-遅延、遅延-面積にトレードオフ関係を確認実務への示唆: 単一最適化では不十分。複数の評価軸での最適化が重要[S2-P43] SNSにおける投稿文とハッシュタグの共通埋め込み空間の構築要点: GraphSAGEを用いてハッシュタグのグラフ構造を学習し、投稿文との対照学習で共通埋め込み空間を構築手法: 同一投稿内のハッシュタグをグラフで結合→GNN学習、その後BERT(投稿文)との対照学習結果: ハッシュタグ一致判定タスクでAccuracy 0.849(BERT単体0.564、OpenAI 0.581)実務への示唆: SNS特化のマルチモーダルを目指されており、SNSデータ活用の文脈で応用価値が高い[S4-P01] 環境制約下における機密情報検知制約: セキュリティ面において制約の多い環境のもと、機密情報の自動判定手法: GPT-4で擬似データ生成→Sarashina-70Bで判定→週次改善ループ結果: Recall 0.923達成も、FNが1件あり、その評価が課題実務への示唆: LLMのログ情報の活用余地とそのうえでのボトルネック解消[S4-P06] 拡散言語モデルによる日本語縦読み文章生成要点: 拡散言語モデルによる制約下での流暢な文章生成検証: "大","谷","翔","平"を固定したうえでの文書生成による評価特徴: 正規表現を用いたGPT5の結果がよい実務への示唆: 人間の文書生成メカニズムに近い生成方法ゆえ応用事例に期待おわりに今後もPolaris.AIでは、自然言語分野の社会実装を促進するため、最先端の研究領域のご支援・サポートを進めていきます。また、副業・インターンも絶賛募集中ですので、自然言語・LLM応用を社会実装したい、それに関心がある方は、お気軽にご連絡ください。我々が持ち帰った成果