ポスター発表
ポスター貼り付けスペースは縦174cm、横112.5cmです。
| セッション1 (13:50 - 14:40) | ||||
|---|---|---|---|---|
| No. | タイトル | 発表者 | 大学 | 研究室 |
| 1 | 加齢性難聴者の聞き取り補助に向けた部分的な声質変換 | 大谷 蒼太 | 大阪大学 | 駒谷研 |
| 2 | 音声対話システムにおけるシステム側の心情表出を目的としたフィラー付与 | 宮内 雅望 | 大阪工業大学 | 鈴木研 |
| 3 | 人間らしいストローク表現を備えた初心者向けギターMIDI生成システムの開発 | 三宅 志門 | 大阪工業大学 | 鈴木研 |
| 4 | 遺伝的アルゴリズムを用いたギター演奏音からのエフェクタパラメータの推定 | 碓永 慎之助 | 大阪工業大学 | 鈴木研 |
| 5 | Enhancing Deeper Emotional Support Through Multilingual Emotional Validation in Dialogue System | Pang Zi Haur | 京都大学 | 河原研 |
| 6 | Dual-path Feature Extraction for Source Separation with Distributed Microphones | Chen Junzhe | 京都大学 | 河原研 |
| 7 | 発表取消 | |||
| 8 | 正面0.5mにある音源の放射方向の聞き分け能力について | 大島 若菜 | 大阪産業大学 | 高橋研 |
| 9 | 系列型声質変換モデルのモバイル端末実装 | 山下 陽生 | 神戸大学 | 滝口研 |
| 10 | CTCとWFSTを用いたハイブリッドシステムによる舌切除者の単語及び連続数字音声認識 | 土師 梧刀 | 神戸大学 | 滝口研 |
| 11 | Efficient Transformer-Based Piano Transcription With Sparse Attention Mechanisms | Weixing Wei | 京都大学 | 吉井研 |
| 12 | Narrativity-Aware Video Summarization Based on Vision and Language Foundation Models | 齋藤 駿平 | 京都大学 | 吉井研 |
| 13 | 音楽特徴量と音響印象語の対応分析 | 飯島 日菜 | 滋賀大学 | 市川研 |
| 14 | LLMの応答制御のための中間表現の分析 | 田辺 文彦 | 滋賀大学 | 南條研 |
| 15 | 大規模言語モデルにおける感情推論の可視化分析 | 曽我 美結 | 滋賀大学 | 南條研 |
| 16 | 講義動画における発話の「間」が記憶定着に与える影響 | 宮下 築 | 滋賀大学 | 南條研 |
| 17 | NAIST Simultaneous Speech Translation System for IWSLT 2025 | 譚 皓天 | 奈良先端科学技術大学院大学 | サクティ研 |
| 18 | NAIST Offline Speech Translation System for IWSLT 2025 | Faradishi Widiaputri | 奈良先端科学技術大学院大学 | サクティ研 |
| 19 | 自己教師あり音声モデルの韻律表現獲得における層別分析 | 谷端 真瑠 | 奈良先端科学技術大学院大学 | サクティ研 |
| 20 | 同時機械翻訳のための順送り方略における聞き手の認知負荷評価と要因分析 | 児島 ひかる | 奈良先端科学技術大学院大学 | サクティ研 |
| 21 | Break Indexに基づくセグメンテーションを用いる日英ストリーミング音声翻訳モデル | 宮原絃造 | 同志社大学 | 加藤研 |
| 22 | 拡散確率モデルによるデータ拡張を用いた少量学習データでの構音障害者音声認識 | 蓑毛 悠晟 | 和歌山大学 | 陳研 |
| 23 | CommonVoiceコーパスを用いた複数話者TTSの検討 | 張 珠煐 | 和歌山大学 | 西村研 |
| 24 | Bite Sounds Analysis for Oral Functions Assessment | 橋田 朋希 | 立命館大学 | 西浦研 |
| 25 | Evaluation of intermodulation-based auditory masking for audible area control by amplitude-modulated wave and sidebands of frequency-modulated wave | 森山 慶一 | 立命館大学 | 西浦研 |
| 26 | High-frequency components reconstruction with Transformer-based Denoising for Separated Speech Recorded by Optical Laser Microphone | 孫 胡傑 | 立命館大学 | 西浦研 |
| 27 | リアルタイム音声対話のための対照学習に基づく応答選択 | 大中 緋慧 | 奈良先端科学技術大学院大学 | 吉野研 |
| 28 | Efficient ASR Domain Adaptation with Long Noun Phrases: Harnessing the Linguistic Characteristics of Japanese | 小松 秀輔 | 奈良先端科学技術大学院大学 | 吉野研 |
| 29 | 言語モデルの語用論的推論能力の向上 | 佐藤 拓真 | 奈良先端科学技術大学院大学 | 吉野研 |
| 30 | エフェクトを適用したギター音の印象推定 | 原田 優稀 | 立命館大学 | 高島研 |
| セッション2 (14:50 - 15:40) | ||||
| No. | タイトル | 発表者 | 大学 | 研究室 |
| 1 | 長期対話における記憶保持モデルのための対話データの自動生成手法の検討 | 小川 優介 | 大阪大学 | 駒谷研 |
| 2 | 音声感情認識における発話テキストの併用効果の分析 | 大畑 尚也 | 大阪工業大学 | 鈴木研 |
| 3 | AV-HuBERTを用いた唇動画像からの音声生成法 | 奥田 英智 | 大阪工業大学 | 鈴木研 |
| 4 | 楽器音の印象空間表現を利用した楽曲の印象操作法 | 川端 忠大 | 大阪工業大学 | 鈴木研 |
| 5 | LLMによる対話における驚き反応の生成 | 竹内 一央 | 京都大学 | 河原研 |
| 6 | 日本語諸方言コーパスに対する音素転記を活用した方言識別と標準語転記 | 本多 智揮 | 京都大学 | 河原研 |
| 7 | 多チャネル音源分離とターンテイキング予測の同時最適化 | 溝渕 悠朔 | 京都大学 | 河原研 |
| 8 | 分散マイクロホンによる放射パターン推定に基づくリモート頭部方向推定 | 青木 亮太 | 大阪産業大学 | 高橋研 |
| 9 | 音素ごとに異なる重みを持つパラメータ加重平均モデルによる脊髄性筋萎縮症者の音声合成 | 長久保 諒 | 神戸大学 | 滝口研 |
| 10 | 生成モデルに基づくゼロショット音響イベント分類における分布外検出モデルを用いたクラス間バイアス補正 | 上原 康平 | 神戸大学 | 滝口研 |
| 11 | VAE-3DGS: 姿勢モデルを用いた少数視点からの人体形状推定 | 坪田 和也 | 京都大学 | 吉井研 |
| 12 | 物体追跡に基づくユーザ選択型リアルタイム音声強調システム | 小野 稜介 | 京都大学 | 吉井研 |
| 13 | プレイリストに内在する人間の感性に基づく楽曲特徴量 | 西原 泰宇 | 滋賀大学 | 市川研 |
| 14 | 対話相手の性格特性を考慮した説得は人狼ゲームにおいて有効か | 小濵 賢史 | 滋賀大学 | 南條研 |
| 15 | whisperが文字起こし苦手な音声の調査とファインチューニングの効果 | 小島 萌々夏 | 滋賀大学 | 南條研 |
| 16 | 意味と空間の複合知識を要する地理的推論ベンチマークの自動生成 | 水津 徹久 | 奈良先端科学技術大学院大学 | サクティ研 |
| 17 | Rethinking Robust ASR Strategies: Can Textual In-Context Learning Improve Acoustic Robustness? | Benita Titalim | 奈良先端科学技術大学院大学 | サクティ研 |
| 18 | Beyond One-Shot Dubbing: Leveraging N-Best Translation and Prompted Paraphrasing with Synchrony-Aware Re-Ranking | Jan Meyer Saragih | 奈良先端科学技術大学院大学 | サクティ研 |
| 19 | ルールベースのオフライン内観療法セルフケアAIのための疑似データを利用した内観報告分類モデルの構築 | 有國 開成 | 奈良先端科学技術大学院大学 | サクティ研 |
| 20 | AIによるテキストの感情・主観性調整機能の精度と影響評価 | 八鍬 海 | 奈良先端科学技術大学院大学 | サクティ研 |
| 21 | wav2vec 2.0の中間表現を用いた第二言語英語音声の発音誤り検出・診断モデル | 前田幸洋 | 同志社大学 | 加藤研 |
| 22 | 深層学習による音声了解度の参照信号不要な客観評価 | 羅 文煜 | 和歌山大学 | 陳研 |
| 23 | SSL特徴量を用いた歌声と楽器音の変換手法の検討 | 繁田 あゆか | 和歌山大学 | 西村研 |
| 24 | Distance and Direction Control of Virtual Sound Sources based on Direct-to-Reverberant Ratio Correction Using Parametric Array Loudspeakers and Electro-dynamic Loudspeakers | 山﨑 拓海 | 立命館大学 | 西浦研 |
| 25 | ハイパーソニック・プリバーチャルリード信号を用いた音像強調における超音波信号の設計 | 今中 崚太 | 立命館大学 | 西浦研 |
| 26 | Speech leakage reduction using sideband decomposition with a logarithmic scale in double sideband modulation with suppressed carrier for pin-spot audio | 岩上 瑞希 | 立命館大学 | 西浦研 |
| 27 | Dialogue Response Prefetching Based on Semantic Similarity and Prediction Confidence of Language Model | 森 清忠 | 奈良先端科学技術大学院大学 | 吉野研 |
| 28 | 目標指向対話における話題への誘導感の自動評価と発話選択 | 吉田 快 | 奈良先端科学技術大学院大学 | 吉野研 |
| 29 | Leveraging LLMs for Co-Speech Motion Generation to Enhance Engagement in Human–Robot Dialogue | Muhammad Yeza Baihaqi | 奈良先端科学技術大学院大学 | 吉野研 |
| 30 | 小規模学習データによる楽曲補完におけるGANを用いた自然性の改善 | 苗村 公明 | 立命館大学 | 高島研 |
| セッション3 (15:50 - 16:40) | ||||
| No. | タイトル | 発表者 | 大学 | 研究室 |
| 1 | ターンテイキング予測のためのコーパスの現象と正解の不一致に着目した学習データクレンジングの検討 | 久保 裕之輔 | 大阪大学 | 駒谷研 |
| 2 | 深層強化学習を用いた特徴量変換法におけるスペクトル表現パラメータの最適化 | 原田 律希 | 大阪工業大学 | 鈴木研 |
| 3 | wav2lipによる音声からの唇動画生成における日本語適応の効果 | 安田 大地 | 大阪工業大学 | 鈴木研 |
| 4 | 発話テキストからの感情識別における音声認識誤りの影響の分析 | 済陽 聖希 | 大阪工業大学 | 鈴木研 |
| 5 | Still Thinking Or Stopped Talking? Dialogue Silence Intention Classification Using Multimodal Large Language Model | Wu Muyun | 京都大学 | 河原研 |
| 6 | Beyond Individual Traits: Leveraging Personality Interactions in SER | Yuan Zicheng | 京都大学 | 河原研 |
| 7 | Self-Distilled Continual Pre-training for Domain Adaptive Audio Representation | Zhang Yizhou | 京都大学 | 河原研 |
| 8 | 音素単位の音声認識とLLMによる文字変換を用いた脳性麻痺者のカスケード型音声認識 | 大谷 赳 | 神戸大学 | 滝口研 |
| 9 | 想起音声分類のための脳磁図データの外れ値除去手法の改良 | 能勢 幸樹 | 神戸大学 | 滝口研 |
| 10 | 音声感情認識と画像変換を用いた日本語感情字幕生成 | 和田 航次郎 | 神戸大学 | 滝口研 |
| 11 | Motif-Aware Piano Transcription | Raynaldi La'lang | 京都大学 | 吉井研 |
| 12 | 授業グループワークにおける発話の意味量指標の提案とその時間効力 | 後藤 礼雄 | 滋賀大学 | 市川研 |
| 13 | Visualizing Music Using Independent Component Analysis (ICA) | 岡本 みづき | 滋賀大学 | 市川研 |
| 14 | 文脈を考慮した機械翻訳のための日仏敬称・親称コーパスの設計 | Mireille Lepage | 滋賀大学 | 南條研 |
| 15 | 大学事務の業務支援のための規程集検索システムの開発 | 谷口巴菜 | 滋賀大学 | 南條研 |
| 16 | Prejudice increases chances of negative attitude towards robots | 長尾 洸吉 | 奈良先端科学技術大学院大学 | サクティ研 |
| 17 | GANおよび拡散モデルに併用可能な高速ニューラルボコーダ | 周 王子茜 | 奈良先端科学技術大学院大学 | サクティ研 |
| 18 | Exploring Speech Embeddings for Dialectal Speech: Case Studies on English and Japanese | 张 雨婷 | 奈良先端科学技術大学院大学 | サクティ研 |
| 19 | 日本語音声基盤モデルは英語をどう聞くか? ― 音韻知覚の分析 | 白井 透 | 奈良先端科学技術大学院大学 | サクティ研 |
| 20 | Speech-driven Facial Expression Generation | 胡 宏伟 | 奈良先端科学技術大学院大学 | サクティ研 |
| 21 | Design and Evaluation of a Knowledge-Driven Multilingual Dialogue System for International Student Support in Doshisha University | Yuxuan Dong | 同志社大学 | 加藤研 |
| 22 | 音声了解度客観評価指標GESIを導入した生成モデルによる難聴者ための音声強調処理 | 孫 浩正 | 和歌山大学 | 陳研 |
| 23 | 略語への意図的な聞き間違いとその解説を行う音声対話システムの開発 | 田村 桃絵 | 和歌山大学 | 西村研 |
| 24 | Acoustic digital archive for Gion festival music using object-based audio with mirror image source method | 加藤 昴 | 立命館大学 | 西浦研 |
| 25 | Evaluation of Degraded Speech Generation Using Dual Style Encoders for Optical Laser Microphone | 中野 裕貴 | 立命館大学 | 西浦研 |
| 26 | 光レーザマイクロホンを用いたマルチチャネルANCシステムの実騒音環境評価 | 水谷 真絃 | 立命館大学 | 西浦研 |
| 27 | Disambiguating Reference in Visually Grounded Dialogues through Joint Modeling of Textual and Multimodal Semantic Structures | 稲積 駿 | 奈良先端科学技術大学院大学 | 吉野研 |
| 28 | 視覚言語モデルにおける構造的曖昧性理解能力の評価及び分析 | 李 相明 | 奈良先端科学技術大学院大学 | 吉野研 |
| 29 | FiLMを活用した音声対話における感情的対話破綻検出 | 中畔 彪雅 | 奈良先端科学技術大学院大学 | 吉野研 |
| 30 | 発表取消 | |||
