メディア情報研究部　過去のニュース｜NTTコミュニケーション科学基礎研究所

2025

2025/7

【外部採録】デルクロア特別研究員による複数人音声認識の評価に関する論文（Paderborn大との共著）「Word Error Rate Definitions and Algorithms for Long-Form Multi-Talker Speech Recognition」が、IEEE Transactions on Audio, Speech and Language Processing に掲載されました。
https://ieeexplore.ieee.org/abstract/document/11082427
2025/7

【外部採録】落合研究主任、デルクロア特別研究員、森谷准特別研究員らによる音声強調に関する論文（NTT 人間情報研究所との共著論文）「Generic speech enhancement with self-supervised representation space loss」が、論文誌Frontiers in Signal Processingに掲載されました。
https://doaj.org/article/421169964ec845128bfd1141dbb4a46e
2025/7

【外部採録】加茂研究員、俵主任研究員、叶研究主任、池下研究主任、森谷准特別研究員、小川主任研究員、落合研究主任、デルクロア特別研究員、中谷上席特別研究員、荒木主幹研究員らによる複数人会話認識に関する論文「Microphone Array Geometry Independent Multi-Talker Distant ASR: NTT System for the DASR Task of the CHiME-8 Challenge」が、論文誌　Computer Speech and Language　に掲載されました。
https://www.sciencedirect.com/science/article/pii/S0885230825000452
2025/7

【外部採録】池下研究主任、中谷上席特別研究員、落合研究主任、荒木主幹研究員らによる音声強調のための分散マイクのサブセット選択に関する論文「Maximizing Predicted Signal-to-Distortion Ratio: A New Microphone Selection Criterion for Beamforming in Acoustic Sensor Networks」が、 IEEE Transactions on Audio, Speech and Language Processing に掲載されました。
https://ieeexplore.ieee.org/document/11017629
2025/6

【外部採録】ドゥクフクポスドク、石川研究主任、原田上席特研員、守谷フェローによる「Acousto-Optic Reconstruction of Exterior Sound Field Based on Concentric Circle Sampling with Circular Harmonic Expansion」がIEEE Transactions on Instrumentation and Measurementに採録されました。
https://ieeexplore.ieee.org/document/11028067
2025/6

【外部採録】仁泉リサーチスペシャリスト、竹内研究員、安田研究員、ビンティエンポスドク、大石主幹研究員、原田登上席特研員による「Probin M2D: Technical Report for the ICME 2025 Audio Encoder Capability Challenge」が、国際会議IEEE International Conference on Multimedia & Expo (ICME 2025)で開催されるAudio Encoder Capability Challengeに採択されました。
2025/6

【外部採録】The Journal of the Acoustical Society of America Express Letters（JASA-EL）に採録された谷川研究員、石川研究主任、原田登上席特別研究員、早稲田大学による「Why Shape Matters: Experimental Evidence behind Sound of Musical Triangle」が、JASA-EL May 2025の表紙カバーイメージに選出されました。
https://pubs.aip.org/asa/jel/issue/5/5
2025/5

【外部採録】谷川研究員、石川研究主任、早稲田大学との共同研究による「Three-Dimensional Sound Field Reconstruction from Optical Projections Using Physics-Informed Neural Networks」がThe Journal of the Acoustical Society of America Express Letters（JASA-EL）に採録されました。
https://pubs.aip.org/asa/jel/article/5/6/064801/3348048/Three-dimensional-sound-field-reconstruction-from
2025/5

【外部採録】国際会議 Interspeech2025に、メディア情報研究部から、14本の論文が採録されました。
https://group.ntt/jp/topics/2025/08/07/interspeech2025.html
・Daisuke Niizumi, Daiki Takeuchi, Binh Thien Nguyen, Masahiro Yasuda, Yasunori Ohishi, Noboru Harada, "Towards Pre-training an Effective Respiratory Audio Foundation Models"
・Daiki Takeuchi, Binh Thien Nguyen, Masahiro Yasuda, Daisuke Niizumi, Yasunori Ohishi, Noboru Harada, "CLAP-ART: Automated Audio Captioning with Semantic-rich Audio Representation Tokenizer"
・Naoyuki Kamo, Tsubasa Ochiai, Marc Delcroix, Tomohiro Nakatani, "MOVER: Combining Multiple Meeting Recognition Systems"
・Koharu Horii, Naohiro Tawara, Atsunori Ogawa, Shoko Araki, "Why is children's ASR so difficult? Analyzing children's phonological error patterns using SSL-based phoneme recognizers"
・Takatomo Kano, Atsunori Ogawa, Marc Delcroix, Ryo Fukuda, Chen William (CMU), Shinji Watanabe (CMU), "Pick and Summarize: Integrating Extractive and Abstractive Speech Summarization"
・Takuhiro Kaneko, Hirokazu Kameoka, Kou Tanaka, Yuto Kondo, "FasterVoiceGrad: Faster One-step Diffusion-Based Voice Conversion with Adversarial Diffusion Conversion Distillation"
・Takuhiro Kaneko, Hirokazu Kameoka, Kou Tanaka, Yuto Kondo, "Vocoder-Projected Feature Discriminator"
・Yuto Kondo, Hirokazu Kameoka, Kou Tanaka, Takuhiro Kaneko, "JIS: A Speech Corpus of Japanese Idol Speakers with Various Speaking Styles"
・Takafumi Moriya, Masato Mimura, Kiyoaki Matsui, Hiroshi Sato, Kohei Matsuura, "Attention-Free Dual-Mode ASR with Latency-Controlled Selective State Spaces"
・Takanori Ashihara, Marc Delcroix, Tsubasa Ochiai, Kohei Matsuura, Shota Horiguchi, "Analysis of Semantic and Acoustic Token Variability Across Speech, Music, and Audio Domains"
・Shota Horiguchi, Atsushi Ando, Marc Delcroix, Naohiro Tawara, "Pretraining Multi-Speaker Identification for Neural Speaker Diarization"
・Shota Horiguchi, Takanori Ashihara, Marc Delcroix, Atsushi Ando, Naohiro Tawara, "Mitigating Non-Target Speaker Bias in Guided Speaker Embedding"
・Marc Delcroix, "Advances in Conversational Speech Recognition" (Survey talk)
・Keigo Wakayama, Tomoko Kawase, Takafumi Moriya, Marc Delcroix, Hiroshi Sato, Tsubasa Ochiai, Masahiro Yasuda, Shoko Araki, "Real-time TSE demonstration via SoundBeam with KD" (Show and Tell)
2025/5

【外部採録】ビンティエンポスドク、安田研究員、竹内研究員、仁泉リサーチスペシャリスト、大石主幹研究員、原田登上席特研員による「Baseline Systems and Evaluation Metrics for Spatial Semantic Segmentation of Sound Scenes」が国際会議European Signal Processing Conference (EUSIPCO2025) に採録されました。
2025/5

【外部採録】谷川研究員、石川研究主任、早稲田大学との共同研究による「Extension of Deep Sound-Field Denoiser to High-Frequency Sound Fields Considering Wavenumber Spectral Loss」が国際会議 IEEE International Conference on Image Processing (ICIP2025) に採録されました。
2025/5

【外部採録】The Journal of the Acoustical Society of America Express Letters（JASA-EL）に採録された谷川研究員、石川研究主任、原田登上席特別研究員、早稲田大学による「Why Shape Matters: Experimental Evidence behind Sound of Musical Triangle」がAIP Publishing Websiteの論文紹介企画の対象に選ばれ、ライターからのインタビューに基づく記事が公開されました。
https://publishing.aip.org/publications/latest-content/would-a-musical-triangle-of-any-other-shape-sound-as-sweet/
2025/4

【外部採録】三鼓研究員, 木村主席研究員, 京都大学による論文「Flexible Source-Free Domain Generalization via Domain Prompt-Discriminator Collaborative Learning」が国際会議International Joint Conference on Neural Networks (IJCNN2025)に採録されました。
2025/4

【外部採録】落合研究主任による目的音抽出に関する解説記事「Target Sound Information Extraction: Speech and Audio Processing With Neural Networks Conditioned on Target Clues」が日本音響学会 Acoustical Science and Technology誌に掲載されました。
https://www.jstage.jst.go.jp/article/ast/46/3/46_e24.124/_article/-char/ja
2025/4

【外部採録】仁泉リサーチスペシャリスト、竹内研究員、安田研究員、ビンティエンポスドク、大石主幹研究員、原田上席特別研究員による論文「Assessing the Utility of Audio Foundation Models for Heart and Respiratory Sound Analysis」が国際学会IEEE Engineering in Medicine and Biology Society (EMBC2025) に採録されました。
https://arxiv.org/pdf/2504.18004
2025/3

【外部採録】金子特別研究員による論文「Structure From Collision」が国際会議 IEEE / CVF Computer Vision and Pattern Recognition Conference (CVPR) に採録されました。
https://cvpr.thecvf.com/virtual/2025/poster/34297
2025/3

【外部採録】デルクロア特別研究員、落合研究主任の遠隔発話音声処理の最新技術に関する解説記事（CMUとの共著） “Module-Based End-to-End Distant Speech Processing: A case study of far-field automatic speech recognition” が、IEEE Signal Processing Magazine に掲載されました。
https://ieeexplore.ieee.org/document/10819672
2025/3

【外部採録】谷川研究員、石川研究主任、原田上席特別研究員および早稲田大学による「Why Shape Matters: Experimental Evidence behind Sound of Musical Triangle」がThe Journal of the Acoustical Society of America Express Letters（JASA-EL）に採録されました。
2025/3

【外部採録】色川リサーチアシスタントによるハイブリッド力学系についての論文「Hybrid Dynamics of Henon Maps」がMathematical Zeitschrift誌に採録されました。
https://arxiv.org/pdf/2212.10851
2025/3

【外部採録】中濱リサーチアシスタントによる非可換調和振動子と量子ラビモデルの関係の論文「Equivalence Between Non-Commutative Harmonic Oscillators and Two-Photon Quantum Rabi Models」がInternational Mathematics Research Notices誌に採録されました。
https://arxiv.org/pdf/2405.19814
2025/3

【出版】宮﨑主任研究員による著書「岩波ジュニアスタートブックス数の『発見』の物語」（岩波書店）が出版されました。
https://www.iwanami.co.jp/book/b658493.html
2025/1

【表彰】三鼓研究員、木村主席研究員、入江元客員研究員（現在東京理科大学）および京都大学との共同研究による論文「Cross-Action Cross-Subject Action Recognition Via Simultaneous Action-Subject Learning with Two-Step Feature Removal」が、画像処理分野の重要国際会議 IEEE International Conference on Image Processing (ICIP2024)において Best Paper Award 1st Runner-up を受賞しました。
https://group.ntt/jp/topics/2025/01/14/icip2024.html
2025/1

【表彰】小川主任研究員がIEEE Open Journal of Signal Processing (OJSP) Editorial Board (編集委員会) における Associate Editor (AE) としての高い貢献に対しIEEE Signal Processing Society (SPS) から IEEE Signal Processing Society 2024 Outstanding Editorial Board Member Award を受賞しました。

2024

2024/12

【表彰】森谷准特別研究員、俵主任研究員、デルクロア特別研究員およびNTT人間情報研究所との混合音声を対象とした話者埋め込み抽出に関する共同研究成果 “Recursive Attentive Pooling for Extracting Speaker Embeddings from Multi-Speaker Recordings”が、国際会議 IEEE Spoken Language Technology Workshop 2024 (SLT2024) で、Best paper honorable mentionを受賞しました。
https://ieeexplore.ieee.org/document/10832241
2024/12

【外部採録】国際会議 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2025)に、メディア情報研究部から、20本の論文が採録されました。
https://group.ntt/jp/topics/2025/03/31/icassp2025.html
・Yuto Kondo, Hirokazu Kameoka, Kou Tanaka, Takuhiro Kaneko, "Core Aggregation via Quantized Distribution Fitting and ITS Application to Predictor Learning"
・Binh Thien Nguyen, Daiki Takeuchi, Masahiro Yasuda, Daisuke Niizumi, Noboru Harada, "Negative and Balanced Sampling for Language-query Audio Source Separation"
・Stefan Bruhn, Tomas Toftgår, Stefan Döhla, Huan-yu Su, Lasse Laaksonen, Takehiro Moriya, Stéphane Ragot, Hiroyuki Ehara, Marek Szczerba, Imre Varga, Andrey Schevciw, Milan Jerinec, "3GPP IVAS Codec – Perspectives on Development, Testing and Standardization"
・Takehiro Moriya, Stephane Ragot, Arnaud Lefort, Alexandre Guerin, Noboru Harada, Ryosuke Sugiura, Yutaka Kamamoto, "EVS-Compatible Downmix in 3GPP IVAS"
・Masahiro Nakano, Hiroki Sakuma, Ryo Nishikimi, Kenji Komiya, Tomoharu Iwata, Kunio Kashino, "Hyperbolic PHATE: Visualizing Continuous Hierarchy of Latent Differentiation Structures"
・Nao Sato, Masahiro Yasuda, Shoichiro Saito, Noboru Harada, "Sound Source Distance Estimation Utilizing Physics-informed Prior for Sound Event Localization and Detection"
・Masahiro Yasuda, Shoichiro Saito, Nao Sato, Noboru Harada, "Spatial Annotation-free Training for Sound Event Localization and Detection"
・Junpei Honma, Akisato Kimura, Go Irie, "Multi-Task Learning for Ultrasonic Echo-based Depth Estimation with Audible Frequency Recovery"
・Tomohiro Nakatani, Naoyuki Kamo, Marc Delcroix, Shoko Araki, "A Hybrid Probabilistic-Deterministic Model Recursively Enhancing Speech"
・Naohiro Tawara, Atsushi Ando, Shota Horiguchi, and Marc Delcroix, "Multi-channel Speaker Counting for EEND-VC-based Speaker Diarization on Multi-domain Conversation"
・Takatomo Kano, Atsunori Ogawa, Marc Delcroix, William Chen, Ryo Fukuda, Kohei Matsuura, Takanori Ashihara, Shinji Watanabe, "Bridging Speech and Text Foundation Models with ReShape Attention"
・Ryo Fukuda, Takatomo Kano, Atushi Ando, Atunori Ogawa, "Whisper-ER: Speech Emotion Recognition Based on Large-Scale Automatic Speech Recognizer"
・Shoko Araki, Nobutaka Ito, Reinhold Haeb-Umbach, Gordon Wichern, Zhong-Qiu Wang, Yuki Mitsufuji, "30+ Years of Source Separation Research: Achievements and Future Challenges"
・Takafumi Moriya, Shota Horiguchi, Marc Delcroix, Ryo Masumura, Takanori Ashihara, Hiroshi Sato, Kohei Matsuura, Masato Mimura, "Alignment-Free Training for Transducer-based Multi-Talker ASR"
・Carlos Hernandez-Olivan, Marc Delcroix, Tsubasa Ochiai, Daisuke Niizumi, Naohiro Tawara, Tomohiro Nakatani, Shoko Araki, "SoundBeam meets M2D: Target Sound Extraction with Audio Foundation Model"
・Alexis Plaquet, Naohiro Tawara, Marc Delcroix, Atsushi Ando, Shota Horiguchi, Shoko Araki, "Mamba-based Segmentation Model for Speaker Diarization"
・Junyi Peng, Takanori Ashihara, Marc Delcroix, Tsubasa Ochiai, Oldrich Plchot, Shoko Araki, Jan Cernock, "TS-SUPERB: A Target Speech Processing Benchmark for Speech Self-Supervised Learning Models"
・Shota Horiguchi, Takafumi Moriya, Atsushi Ando, Takanori Ashihara, Hiroshi Sato, Naohiro Tawara, Marc Delcroix, "Guided Speaker Embedding"
・Tsubasa Ochiai, Kazuma Iwamoto, Marc Delcroix, Rintaro Ikeshita, Hiroshi Sato, Shoko Araki, "Rethinking Processing Distortions: Disentangling the Impact of Speech Enhancement Errors on Speech Recognition Performance" (Journal Paper Presentation)
・Daisuke Niizumi, Daiki Takeuchi, Yasunori Ohishi, Noboru Harada, Kunio Kashino, "Masked Modeling Duo: Towards Universal Audio Pre-training Framework" (Journal Paper Presentation)
2024/11

【外部採録】国際会議 IEEE/CVF Winter Conference on Applications of Computer Vision (WACV2025) に2本の論文が採録されました。
・Shogo Sato, Takuhiro Kaneko, Kazuhiko Murasaki, Taiga Yoshida, Ryuichi Tanida, Akisato Kimura, " Unsupervised Single-Image Intrinsic Image Decomposition With LiDAR Intensity Enhanced Training"
・Risako Tanigawa, Kenji Ishikawa, Noboru Harada, Yasuhiro Oikawa, " SoundSil-DS: Deep Denoising and Segmentation of Sound-Field Images with Silhouettes"
2024/11

【外部採録】石川研究主任らによる「Sound Field Reconstruction Using Optical Sound Measurement and Neural Fields」が国際会議IEEE International Workshop on Machine Learning for Signal Processing（MLSP2024)に採録されました。
2024/11

【外部採録】竹内准特別研究員らによる論文「Direct Moment Estimation of Intensity Distribution of Magnetic Fields with Quantum Sensing Network」が論文誌New Journal of Physicsに採録されました。
https://iopscience.iop.org/article/10.1088/1367-2630/ad93f4
2024/11

【外部採録】ブストス研究主任らによる論文「Wolstenholme Primes and Group Determinants of Cyclic Groups」が論文誌Proceedings of the Japan Academy, Ser. Aに採録されました。
https://projecteuclid.org/journals/proceedings-of-the-japan-academy-series-a-mathematical-sciences/volume-100/issue-9/Wolstenholme-primes-and-group-determinants-of-cyclic-groups/10.3792/pjaa.100.011.full?tab=ArticleLink
2024/11

【表彰】三鼓研究員、木村主席研究員および東京理科大学、京都大学らによる「Cross-Action Cross-Subject Skeleton Action Recognition Via Simultaneous Action-Subject Learning with Two-Step Feature Removal」が国際会議 IEEE International Conference on Image Processing (ICIP2024)において Best Paper Award 1st Runner-up を受賞しました。
https://ieeexplore.ieee.org/document/10647253
https://group.ntt/jp/topics/2025/01/14/icip2024.html
2024/10

【外部採録】国際会議Asia Pacific Signal and Information Processing Association (APSIPA) Annual Summit and Conference (APSIPA ASC2024)に2本の論文が採録されました。
・Chihiro Watanabe, Hirokazu Kameoka, "GE2E-AC: Generalized End-to-End Loss Training for Accent Classification"
・Xiao Zhang, Haoran Xing, Mingxue Song, Daiki Takeuchi, Noboru Harada, Shoji Makino, "Prediction-Error-Based Adaptive SpecAugment for Fine-Tuning the Masked Model on Audio Classification Tasks"
2024/10

【外部採録】竹内准特別研究員らによる論文「Rewindable Quantum Computation and Its Equivalence to Cloning and Adaptive Postselection」が論文誌Theory of Computing Systemsに採録されました。
https://link.springer.com/article/10.1007/s00224-024-10208-5
2024/9

【外部採録】中谷上席特別研究員、デルクロア特別研究員、落合研究主任およびPaderborn大学との論文「Microphone Array Signal Processing and Deep Learning for Speech Enhancement」がIEEE Signal Processing Magazine に掲載されました。
https://ieeexplore.ieee.org/document/10819706
2024/9

【外部採録】中谷上席特別研究員、池下研究主任、荒木主幹研究員および早稲田大学との論文「DOA-Informed Switching Independent Vector Extraction and Beamforming for Speech Enhancement in Underdetermined Situations」がEURASIP Journal on Audio, Speech, and Music Processing 誌に採録されました。
https://asmp-eurasipjournals.springeropen.com/articles/10.1186/s13636-024-00373-3
2024/9

【外部採録】仁泉リサーチスペシャリスト、竹内研究員、大石主幹研究員, 原田上席特別研究員、柏野フェローによる論文「Masked Modeling Duo: Towards Universal Audio Pre-Training Framework」がIEEE Transactions on Audio, Speech and Language Processing（TASLP）誌に採録されました。
https://ieeexplore.ieee.org/document/10502167
2024/9

【外部採録】仁泉リサーチスペシャリスト、竹内研究員、大石主幹研究員, 原田上席特別研究員、柏野フェローによる論文「Exploring Pre-Trained General-Purpose Audio Representations for Heart Murmur Detection」が国際会議IEEE Engineering in Medicine and Biology Society（EMBC2024)に採録されました。
https://arxiv.org/pdf/2404.17107
2024/9

【外部採録】国際会議Detection and Classification of Acoustic Scenes and Events（DCASE）2024 Workshopに3本の論文が採録されました。
・Daiki Takeuchi, Masahiro Yasuda, Daisuke Niizumi, Noboru Harada, "Towards Learning a Difference-Aware General-Purpose Audio Representation"
・Tomoya Nishida, Noboru Harada, Daisuke Niizumi, Davide Albertini, Roberto Sannino, Simone Pradolini, Filippo Augusti, Keisuke Imoto, Kota Dohi, Harsh Purohit, Takashi Endo, Yohei Kawaguchi, "Description and Discussion on DCASE 2024 Challenge Task 2: First-Shot Unsupervised Anomalous Sound Detection for Machine Condition Monitoring"
・Daisuke Niizumi, Noboru Harada, Yasunori Ohishi, Daiki Takeuchi, Masahiro Yasuda, "ToyADMOS2#: Yet Another Data for the DCASE2024 Challenge Task 2 First-Shot Anomalous Sound Detection"
2024/9

【外部採録】秋笛研究主任による論文「Probabilistic Unitary and State Synthesis with Optimal Accuracy」が国際会議6th International Workshop on Quantum Compilation (IWQC2024) に採録され、講演を実施しました。
https://dl.acm.org/doi/pdf/10.1145/3663576
2024/9

【外部採録】ブストス研究主任と若山リサーチプロフェッサらによる論文「Zeta Limits for The Spectrum of Quantum Rabi Models」が論文誌Journal of Mathematical Physicsに採録されました。
https://arxiv.org/pdf/2304.08943
2024/7

【外部採録】落合研究主任、デルクロア特別研究員、池下研究主任、荒木主幹研究員らによる論文「Rethinking Processing Distortions: Disentangling the Impact of Speech Enhancement Errors on Speech Recognition Performance」がIEEE/ACM Transactions on Audio, Speech and Language Processing （TASLP）誌に採録されました。
https://ieeexplore.ieee.org/document/10606400
2024/7

【外部採録】木村主席研究員による論文「Acoustic-Based 3D Human Pose Estimation Robust to Human Position」がコンピュータビジョン分野の国際会議The British Machine Vision Conference（BMVC2024)に採録されました。
https://bmva-archive.org.uk/bmvc/2024/papers/Paper_135/paper.pdf
2024/7

【外部採録】デルクロア特別研究員およびNTT人間情報研究所らによる論文「Unveiling the Linguistic Capabilities of a Self-Supervised Speech Model Through Cross-Lingual Benchmark and Layer-Wise Similarity Analysis」がIEEE Access誌に採録されました。
https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=10597571
2024/7

【外部採録】小川主任研究員と豊橋技科大学との共同研究成果「Recognition of Target Domain Japanese Speech Using Language Model Replacement」がEuropean Association for Signal Processing （EURASIP）Journalに採録されました。
https://asmp-eurasipjournals.springeropen.com/articles/10.1186/s13636-024-00360-8
2024/7

【外部採録】佐野研究主任らよる論文「Northcott Numbers for Generalized Weighted Weil Heights」が論文誌Acta Arithmeticaに採録されました。
https://arxiv.org/pdf/2308.03981
2024/7

【外部採録】竹内准特別研究員らによる論文「Finite-Key Security of Differential-Phase-Shift QKD」が国際会議Asian Quantum Information Science Conference（AQIS2024)に採録されました。
2024/7

【外部採録】ブストス研究主任と若山リサーチプロフェッサらによる論文「Spacing Distribution for Quantum Rabi Models」が論文誌Journal of Physics A: Mathematical and Theoreticalに採録されました。
https://arxiv.org/pdf/2310.09811
2024/7

【外部採録】色川リサーチアシスタントによる論文「Activity Measures of Dynamical Systems Over Non-Archimedean Fields」が論文誌Discrete and Continuous Dynamical Systems に採録されました。
https://arxiv.org/pdf/1901.01075
2024/6

【外部採録】国際会議Interspeech2024に7本の論文が採録されました。
・Kohei Matsuura, Takanori Ashihara, Takafumi Moriya, Tomohiro Tanaka, Masato Mimura, Takatomo Kano, Atsunori Ogawa, Marc Delcroix, Taichi Asami, " Sentence-wise Speech Summarization: Task, Datasets, and End-to-End Modeling with LM Knowledge Distillation"
・Hiroshi Sato, Takafumi Moriya, Masato Mimura, Shota Horiguchi, Tsubasa Ochiai, Takanori Ashihara, Atsushi Ando, Kentaro Shinayama, Marc Delcroix, "SpeakerBeam-SS: Real-time Target Speaker Extraction with Lightweight Conv-TasNet and State Space Modeling"
・Kenichi Fujita, Takanori Ashihara, Marc Delcroix, Yusuke Ijima, " Lightweight Zero-shot Text-to-Speech with Mixture of Adapters"
・Marvin Tammen, Tsubasa Ochiai, Marc Delcroix, Tomohiro Nakatani, Shoko Araki, Simon Doclo, "Array Geometry-Robust Attention-Based Neural Beamformer for Moving Speakers"
・Takuhiro Kaneko, Hirokazu Kameoka, Kou Tanaka, Yuto Kondo, " FastVoiceGrad: One-step Diffusion-Based Voice Conversion with Adversarial Conditional Diffusion Distillation”
・Kou Tanaka, Hirokazu Kameoka, Takuhiro Kaneko, Yuto Kondo, “PRVAE-VC2: Non-Parallel Voice Conversion by Distillation of Speech Representations”
・Daisuke Niizumi, Daiki Takeuchi, Yasunori Ohishi, Noboru Harada, Masahiro Yasuda, Shunsuke Tsubaki, Keisuke Imoto, "M2D-CLAP: Masked Modeling Duo Meets CLAP for Learning General-purpose Audio-Language Representation"
2024/6

【外部採録】国際会議European Signal Processing Conference（EUSIPCO2024）に2本の論文が採録されました。
・Yuto Kondo, Hirokazu Kameoka, Kou Tanaka, Takuhiro Kaneko, Noboru Harada, “Learning to Assess Subjective Impressions Conveyed Through Speech”
・Shunsuke Tsubaki, Daisuke Niizumi, Daiki Takeuchi, Yasunori Ohishi, Noboru Harada, Keisuke Imoto, “Refining Knowledge Transfer on Audio-Image Temporal Agreement for Audio-Text Cross Retrieval”
2024/6

【外部採録】金子特別研究員が画像電子学会のAdvanced Image Seminar (AIS2024)において「深層生成モデルの基礎と応用」の学術講演を実施しました。
2024/5

【外部採録】柏野フェロー、木村主席研究員らによる「Detection of Acute Myeloid Leukemia without Labeling Individual Blood Cells」が国際会議IEEE Engineering in Medicine and Biology Society（EMBC2024）に採録されました。
2024/5

【外部採録】秋笛研究主任、情報通信研究機構、早稲田大学らによる論文「Probabilistic Unitary Synthesis with Optimal Accuracy」が論文誌ACM Transactions on Quantum Computingに採録されました。
https://arxiv.org/html/2301.06307v2
2024/5

【外部採録】秋笛研究主任と立命館大学による論文「Non-locality of Conjugation Symmetry: Characterization and Examples in Quantum Network Sensing」が論文誌New Journal of Physicsに採録されました。
https://arxiv.org/html/2309.12523v2
2024/4

【外部採録】IEEE/ACM Transactions on Audio, Speech, and Language Processing（IEEE/ACM Trans. ASLP）に2本の論文が採録されました。
・Hirokazu Kameoka, Takuhiro Kaneko, Kou Tanaka, Nobukatsu Hojo, Shogo Seki, "VoiceGrad: Non-Parallel Any-to-Many Voice Conversion with Annealed Langevin Dynamics"
・Daisuke Niizumi, Daiki Takeuchi, Yasunori Ohishi, Noboru Harada, Kunio Kashino, "Masked Modeling Duo: Towards a Universal Audio Pre-training Framework"
2024/4

【外部採録】琉球大学と若山正人リサーチプロフェッサによる論文「Partition Functions for Non-commutative Harmonic Oscillators and Related Divergent Series」が論文誌Indagationes Mathematicaeに採録されました。
https://www.sciencedirect.com/science/article/abs/pii/S0019357724000612?via%3Dihub
2024/4

【外部採録】論文集Mathematical Foundations for Post-Quantum Cryptographyに2本の論文が採録されました。
・Ryosuke Nakahama, “Representation Theory of sl(2,R)=su(1,1) and a Generalization of Non-commutative Harmonic Oscillators”
・Cid Reyes-Bustos, “Towards Hash Functions Based on Group-subgroup Pair Graphs”
2024/3

【外部採録】国際会議 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2024)に2本の論文が採録されました。
・Yu Mitsuzumi, Akisato Kimura, Hisashi Kashima, "Understanding and Improving Source-free Domain Adaptation from a Theoretical Perspective"
・Takuhiro Kaneko, "Improving Physics Augmented Continuum Neural Radiance Fileds-Based Geometry-Agnostic System Identification with Lagrangian Particle Optimization"
2024/3

【外部採録】池下研究主任、中谷上席研究員による” Geometrically-Regularized Fast Independent Vector Extraction by Pure Majorization-Minimization”がIEEE Transactions on Signal Processing誌に採録されました。
https://ieeexplore.ieee.org/document/10466407
2024/2

【外部採録】国際会議 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2024) 併設のワークショップに5本の論文が採録されました。
・Junyi Peng, Marc Delcroix, Tsubasa Ochiai, Oldrich Plchot, Takanori Ashihara, Shoko Araki, Jan Cernocky, "Probing Self-supervised Learning Models with Target Speech Extraction"
・Thilo von Neumann, Christoph Boeddeker, Tobias Cord-Landwehr, Marc Delcroix, Reinhold Haeb-Umbach, "Meeting Recognition with Continuous Speech Separation and Transcription-Supported Diarization"
・Rino Kimura, Tomohiro Nakatani, Naoyuki Kamo, Marc Delcroix, Shoko Araki, Tetsuya Ueda, Shoji Makino, "Diffusion model-based MIMO speech denoising and dereverberation"
・Hao Shi, Naoyuki Kamo, Marc Delcroix, Tomohiro Nakatani and Shoko Araki, "ENSEMBLE INFERENCE FOR DIFFUSION MODEL-BASED SPEECH ENHANCEMENT"
・Bo He, Shiqi Zhang, Xianrui Wang, Zheng Qiu, Daiki Takeuchi, Daisuke Niizumi, Noboru Harada, Shoji Makino, “Light Gated Multi Mini-patch Extractor for Audio Classification”
また，ICASSP2024 Show & Tell Demos に2本の論文が採択されました．
・Yasunori Ohishi, Marc Delcroix, Tsubasa Ochiai, Shoko Araki, Daiki Takeuchi, Daisuke Niizumi, Akisato Kimura, Noboru Harada, Kunio Kashino “Target Speech Spotting and Extraction Based on ConceptBeam”
・Thilo von Neumann, Christoph Boeddeker, Marc Delcroix, Reinhold Haeb-Umbach, "MeetEval, Show Me the Errors! Interactive Visualization of Transcript Alignments for the Analysis of Conversational ASR"
2024/2

【外部採録】中野特別研究員、佐久間研究員、錦見研究員、渋江研究員、佐藤主任研究員、岩田上席特別研究員、柏野フェローによる“Warped Diffusion for Latent Differentiation Inference”がInternational Conference on Artificial Intelligence and Statistics (AISTATS2024)に採択されました。
https://proceedings.mlr.press/v238/nakano24a.html
2024/1

【外部採録】宮﨑研究主任と東京大学によるモチーフ理論についての論文”A motivic construction of the de Rham-Witt complex”がJournal of Pure and Applied Algebraに採録されました。
https://www.sciencedirect.com/science/article/pii/S0022404923002840
2024/1

【表彰】落合翼研究主任が第8回 IEEE Signal Processing Society (SPS) Japan Young Author Best Paper Award を受賞しました。
https://www.ieee-jp.org/section/tokyo/chapter/SP-01/sp.htm#HYOUSHOU
2024/1

【表彰】谷特別研究員による「量子計算機アルゴリズムの先駆的研究を通じた耐量子計算機暗号技術の安全性評価への貢献」が2023年度SCAT表彰会長賞を受賞しました。
https://www.scat.or.jp/cms/wp-content/uploads/2023/12/award-press2023.pdf

2023

2023/12

【外部採録】藤原特別研究員、中野特別研究員、木村主席研究員、コンピュータ&データサイエンス研究所、人間情報研究所による「Efficient Algorithm for K-Multiple-Means」が ACM SIGMOD International Conference on Management of Data (SIGMOD2024) に採録されました。
https://dl.acm.org/doi/10.1145/3639273
2023/12

【外部採録】国際会議 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2024) に 13本の論文が採録されました。
・Naohiro Tawara, Marc Delcroix, Atsushi Ando, Atsunori Ogawa, “NTT speaker diarization system for CHiME-7: multi-domain, multi-microphone End-to-end and vector clustering diarization”
・Dominik Klement, Mireia Diez, Federico Landini, Lukas Burget, Anna Silnova, Marc Delcroix, Naohiro Tawara, “Discriminative Training of VBx Diarization”
・Junyi Peng, Marc Delcroix, Tsubasa Ochiai, Oldrich Plchot, Shoko Araki, Jan Cernocky, “Target Speech Extraction with Pre-Trained Self-Supervised Learning Models”
・William Chen, Takatomo Kano, Atsunori Ogawa, Marc Delcroix, Shinji Watanabe, “Train Long and Test Long: Leveraging Full Document Contexts in Speech Processing”
・Hanako Segawa, Tsubasa Ochiai, Marc Delcroix, Tomohiro Nakatani, Rintaro Ikeshita, Shoko Araki, Takeshi Yamada, Shoji Makino, “Neural Network-Based Virtual Microphone Estimation with Virtual Microphone and Beamformer-Level Multi-Task Loss”
・Kazuma Iwamoto, Tsubasa Ochiai, Marc Delcroix, Rintaro Ikeshita, Hiroshi Sato, Shoko Araki, Shigeru Katagiri, “How Does End-To-End Speech Recognition Training Impact Speech Enhancement Artifacts?”
・Keigo Wakayama, Tsubasa Ochiai, Marc Delcroix, Masahiro Yasuda, Shoichiro Saito, Shoko Araki, Akira Nakayama, “Online Target Sound Extraction with Knowledge Distillation from Partially Non-Causal Teacher”
・Takanori Ashihara, Marc Delcroix, Takafumi Moriya, Kohei Matsuura, Taichi Asami, Yusuke Ijima, “What Do Self-Supervised Speech and Speaker Models Learn? New Findings From a Cross Model Layer-Wise Analysis”
・Kenichi Fujita, Hiroshi Sato, Takanori Ashihara, Hiroki Kanagawa, Marc Delcroix, Takafumi Moriya, Yusuke Ijima, “Noise-Robust Zero-Shot Text-to-Speech Synthesis Conditioned on Self-Supervised Speech-Representation Model with Adapters”
・Shiqi Zhang, Daiki Takeuchi, Noboru Harada, Shoji Makino, “Unrestricted Global-Phase-Bias Aware Single-channel Speech Enhancement with Conformer-based Metric GAN”
・Yuto Kondo, Hirokazu Kameoka, Kou Tanaka, Takuhiro Kaneko, “Selecting N-Lowest Scores for Training MOS Prediction Models“
・Takuhiro Kaneko, Hirokazu Kameoka, Kou Tanaka, “Training Generative Adversarial Network-Based Vocoder with Limited Data Using Augmentation-Conditional Discriminator”
・Masahiro Nakano, Ryohei Shibue, Kunio Kashino, “Sunflower Strategy for Bayesian Relational Data Analysis”
2023/12

【外部採録】中谷上席特別研究員、池下研究員、荒木主幹研究員による“Blind and Spatially-Regularized Online Joint Optimization of Source Separation, Dereverberation, and Noise Reduction”が IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP) 誌に採録されました。
https://ieeexplore.ieee.org/document/10384838
2023/12

【外部採録】錦見研究員、中野特別研究員、柏野フェロー、塚田フェローによる“Variational Autoencoder-Based Neural Electrocardiogram Synthesis Trained by FEM-Based Heart Simulator”がCardiovascular Digital Health Journalに採録されました。
https://www.cvdigitalhealthjournal.com/article/S2666-6936(23)00110-X/fulltext
2023/12

【外部採録】大阪大学と土田研究主任、柏野フェローによる“Gene correction and overexpression of TNNI3 improve impaired relaxation in engineered heart tissue model of pediatric restrictive cardiomyopathy”がDevelopment, Growth & Differentiation誌に採録されました。
https://onlinelibrary.wiley.com/doi/10.1111/dgd.12909
2023/12

【外部採録】秋笛研究主任員、谷特別研究員による量子状態生成についての論文“Probabilistic state synthesis based on optimal convex approximation”が Quantum Information誌に採録されました。
https://www.nature.com/articles/s41534-023-00793-7
2023/12

【外部採録】竹内准特別研究員と中央大学による量子状態推定についての論文“Fidelity-estimation method for graph states with depolarizing noise”がPhysical Review Research誌に採録されました。
https://journals.aps.org/prresearch/abstract/10.1103/PhysRevResearch.5.043260
2023/11

【外部採録】藤原特別研究員、大阪大学、国立天文台、TDAI Labらによる「Effective Detection of Variable Celestial Objects Using Machine Learning-based Periodic Analysis」が Astronomy and Computing 誌に採録されました。
N. Chihara, T. Takata, Y. Fujiwara, K. Noda, K. Toyoda, K. Higuchi, M. Onizuka, “Effective detection of variable selestial objects using machine learning-based periodic analysis,” Astronomy and Computing. 2023.
https://www.sciencedirect.com/science/article/pii/S221313372300080X
2023/11

【外部採録】石川研究主任員、白木担当課長、守谷フェロー、日本大学、日達主任研究員、小栗主席研究員らによる論文「Comprehensive Noise Analysis for Acousto-optic Measurement of Airborne Sound」がIEEE Transactions on Instrumentation and Measurement に採録されました。
Kenji Ishikawa, Yoshifumi Shiraki, Takehiro Moriya, Atsushi Ishizawa, Kenichi Hitachi, Katsuya Oguri, “Comprehensive noise analysis for acoustro-optic measurement of airborne sound,” IEEE Transactions on Instrumentation and Measurement, 2023.
Comprehensive Noise Analysis for Acousto-Optic Measurement of Airborne Sound | IEEE Journals & Magazine | IEEE Xplore
2023/11

【外部採録】石川研究主任員、早稲田大学による「Physical-model-based reconstruction of three-dimensional sound field from multi-directional measurement by parallel phase-shift interferometry」が Journal of Acoustical Society of America (JASA) に採録されました。
Haruka Nozawa, Mayuko Imanishi, Yasuhiro Oikawa, Keji Ishikawa, “Physical-model-based reconstruction of three-dimensional sound field from multi-directional measurement by parallel phase-shift interferometry,” Journal of Acoustical Society of America (JASA), 2023.
Physical-model-based reconstruction of three-dimensional sound field from multi-directional measurement by parallel phase-shift interferometry | The Journal of the Acoustical Society of America | AIP Publishing
2023/11

【外部採録】中濱リサーチアソシエイトが、表現論についての招待制の国際会議 7th Tunisian-Japanese Conference: Geometric and Harmonic Analysis on Homogeneous Spacesand Applicationsにおいて、リー群の表現論についての口頭発表「Holographic and symmetry breaking operators of holomor-phic discrete series representations for (SU(3,3),SO*(6))」を実施しました。
Tunisian-Japanese Conference - 2023 (7th)
2023/11

【外部採録】秋笛研究主任が、量子技術の国際会議 Quantum Innovation 2023 において、確率的量子コンパイラについての招待講演「Optimal convex approximation of quantum superposition and its application in reshaping compilation errors」を実施しました。
quantum innovation 2023
2023/11

【外部採録】竹内准特別研究員が、ワイヤレス通信の国際会議 WPMC2023において、チュートリアル講演の招待を受け、量子通信と量子センシングについての講演「Quantum Computation And Sensing On Network」を実施しました。
Tutorials wpmc2023 – WPMC-Home
2023/10

【外部採録】三鼓研究員、木村主席研究員らによる「Phase Randomization: A Data Augmentation for Domain Adaptation in Human Action Recognition」が Pattern Recognitionに採録されました。
Yu Mitsuzumi, Go Irie, Akisato Kimura, Atsushi Nakazawa, “Phase randomization: A data augmentation for domain adaptation in human action recognition,” Pattern Recognition, 2023.
https://doi.org/10.1016/j.patcog.2023.110051
2023/10

【外部採録】杉浦研究員，鎌本担当部長、守谷フェローらによる「General form of almost instantaneous fixed-to-variable-length codes and optimal code tree construction」がIEEE Transactions on Information Theoryに採録されました。
Ryosuke Sugiura, Yutaka Kamamoto, Takehiro Moriya, “General form of almost instantaneous fixed-to-variable-length codes and optimal code tree construction,” IEEE Transactions on Information Theory ( Volume: 69, Issue: 12, December 2023.
DOI: 10.1109/TIT.2023.3314812
2023/10

【外部採録】宮﨑研究主任と東京大学の共同研究による一般化モチーフ理論に関する研究内容「Hodge cohomology with a ramification filtration, I」が Mathematische Zeitschrift誌に採録されました。
Shane Kelly, Hiroyasu Miyazaki, “Hodge cohomology with a ramification filtration, I,” Mathematische Zeitschrift, 12 June 2023.
2023/10

【外部採録】堀永リサーチアソシエイトが早稲田大学との共同研究による、保型形式に関する研究内容「Cuspidal components of Siegel modular forms for large discrete series representations of Sp_4(R)」がManuscripta Mathematica誌に採録されました。
Shuji Horinaga, Hiroaki Narita, “Cuspidal components of Siegel modular forms for large discrete series representations of Sp4(R),” Manuscripta Mathematica, 2023.
https://arxiv.org/abs/2301.11552v1
2023/10

【外部採録】竹内准特別研究員が産業技術総合研究所との共同研究で行った、匿名量子センシングの論文「Anonymous Quantum Sensing」が、量子情報等についての国際会議ICQNMに採録されました。
Hiroto Kasai, Yuki Takeuchi, Hideaki Hakoshima, Yuichiro Matsuzaki, Yasuhiro Tokura, “Anonymous quantom sensing,” International Conference on Quantum, Nano/Bio and Micro Technologies (ICQNM), 2023.
Journal of the Physical Society of Japan 91, 074005 (2022)
2023/9

【外部採録】関リサーチアソシエイト、亀岡上席特別研究員、金子特別研究員、田中研究主任員による「Non-parallel Whisper-to-Normal Speaking Style Conversion Using Auxiliary Classifier Variational Autoencoder」がIEEE Access誌に採録されました。
Shogo Seki, Hirokazu Kameoka, Takuhiro Kaneko, Kou Tanaka, “Non-parallel whisper-to-normal speaking style conversion using auxiliary classifier variational autoencoder,” IEEE Access, Vol.11, pp. 44590 - 44599, 2023.
https://ieeexplore.ieee.org/document/10109017
2023/9

【外部採録】石川研究員とTechnical University of Denmarkによる「A Century of Acousto-Optics: From Early Discoveries to Modern Sensing of Sound with Light」がAcoustics Today誌に採録されました。
Acoustics Today, Vol. 19, Iss. 3, pgs. 54-62
2023/9

【外部採録】Cid Reyes-Bustosリサーチアソシエイトによる「光と物質の相互作用モデルである量子ラビモデルを拡張した非可換量子ラビモデルについての研究内容」がJournal of Physics A: Mathematical and Theoreticalに採録されました。
Cid Reyes-Bustos. “Heat kernel for the quantum Rabi model: II. Propagators and spectral determinants,56 (2023) 425302.
2023/8

【外部採録】木村主幹研究員と九州大学による「Towards defensive letter design」がIAPR Asian Conference on Pattern Recognition (ACPR2023) に採録されました。
Rentato Katakoka, Akisato Kimura, Seiichi Uchida, “Towards defensive letter design,” IAPR Asian Conference on Pattern Recognition (ACPR), 2023.
https://link.springer.com/chapter/10.1007/978-3-031-47634-1_9
2023/8

【外部採録】木村主幹研究員と九州大学による「Selective scene text removal」がBritish Machine Vision Conference (BMVC2023) に採録されました。
Hayato Mitani, Akisato Kimura, Seiichi Uchida, “Selective scene text removal,” British Machine Vision Conference (BMVC), 2023.
https://proceedings.bmvc2023.org/521/
2023/8

【外部採録】藤原特別研究員、中野特別研究員、木村主幹研究員、NTTコンピュータ&データサイエンス研究所による「Efficient Network Representation Learning via Cluster Similarity」がSpringer Data Science and Engineering 誌に採録されました。
Yasuhiro Fujiwara, Yasutoshi Ida, Atsutoshi Kumagai, Masahiro Nakano, Akisato Kimura, Naonori Ueda, "Efficient network representation learning via cluster similarity," Data Science and Engineering, 2023.
https://link.springer.com/article/10.1007/s41019-023-00222-x
2023/8

【外部採録】国際会議 Asia-Pacific Signal and Information Processing Association (APSIPA) Annual Summit and Conference (ASC) 2023に 6本の論文が採録されました。
・Yuki Kitagishi, Hosana Kamiyama, Naohiro Tawara, Atsunori Ogawa, Noboru Miyazaki, and Taichi Asami,”Coarse-age loss: A new training method using coarse-age labeled data for speaker age estimation.”
・Koharu Horii, Kengo Ohta, Ryota Nishimura, Atsunori Ogawa, and Norihide Kitaoka,”Language modeling for spontaneous speech recognition based on disfluency labeling and generation of disfluent text.”
・Keigo Hojo, Daiki Mori, Yukoh Wakabayashi, Kengo Ohta, Atsunori Ogawa, and Norihide Kitaoka,”Combining multiple end-to-end speech recognition models based on density ratio approach.”
・Tatsunari Takagi, Atsunori Ogawa, Norihide Kitaoka, and Yukoh Wakabayashi,”Streaming end-to-end speech recognition using a CTC decoder with substituted linguistic information.”
・Chihiro Watanabe, Hirokazu Kameokay, “DisC-VC: Disentangled and F0-Controllable Neural Voice Conversion.”
・Keisuke Takazawa, Hirokazu Kameokay, Masahiro Yukawa, “Multiple sound source tracking based on generative modeling and recursive Bayesian filtering of spatial gradient spectra.”
2023/8

【外部採録】国際会議 Workshop on Detection and Classification of Acoustic Scenes and Events (DCASE2023) に4本の論文が採録されました。
・Boxin Liu, Shiqi Zhang, Daiki Takeuchi, Daisuke Niizumi, Noboru Harada, Shoji Makino, ”Masked modeling duo vision transformer with multi-layer feature fusion on respiratory sound classification”
・Daiki Takeuchi, Yasunori Ohishi, Daisuke Niizumi, Noboru Harada, Kunio Kashino, ” Similarity-discrepancy disentanglement for audio difference captioning”
・Kota Dohi, Keisuke Imoto, Noboru Harada, Daisuke Niizumi, Yuma Koizumi, Tomoya Nishida, Harsh Purohit, Ryo Tanabe, Takashi Endo, Yohei Kawaguchi, ” Description and Discussion on DCASE 2023 Challenge Task 2: First-Shot Unsupervised Anomalous Sound Detection for Machine Condition Monitoring”
・Noboru Harada, Daisuke Niizumi, Daiki Takeuchi, Yasunori Ohishi, Masahiro Yasuda, ” ToyADMOS2+: New Toyadmos Data and Benchmark Results of the First-Shot Anomalous Sound Event Detection Baseline”
2023/8

【外部採録】Cid Reyes-Bustosリサーチアソシエイトと若山正人リサーチプロフェッサによる、光と物質の相互作用モデルである量子ラビモデルについての研究内容が、Communications in Mathematical Physicsに採録されました。
Cid Reyes-Bustos, Masato Wakayama, “Covering Families of the Asymmetric Quantum Rabi Model: η-Shifted Non-commutative Harmonic Oscillators,” Communications in Mathematical Physics volume 403, pages1429–1476 (2023)
https://link.springer.com/article/10.1007/s00220-023-04825-3
2023/8

【表彰】木村主幹研究員と東京理科大学による「特徴の変換に基づく選択的忘却」が画像の認識・理解シンポジウム (MIRU2023) にて MIRU長尾賞を受賞しました。
http://cvim.ipsj.or.jp/MIRU2023/award/
2023/7

【外部採録】金子特別研究員による論文 “MIMO-NeRF: Fast Neural Rendering with Multi-input Multi-output Neural Radiance Fields” が国際会議 IEEE/CVF International Conference on Computer Vision (ICCV2023) に採録されました。
Takuhiro Kaneko, “MIMO-NeRF: Fast Neural Rendering with Multi-Input Multi-Output Neural Radiance Fields,” IEEE/CVF International Conference on Computer Vision (ICCV2023), 2023.
https://openaccess.thecvf.com/content/ICCV2023/html/Kaneko_MIMO-NeRF_Fast_Neural_Rendering_with_Multi-input_Multi-output_Neural_Radiance_Fields_ICCV_2023_paper.html
2023/7

【外部採録】金子特別研究員と東京大学による論文 “Frame-Level Event Representation Learning for Semantic-Level Generation and Editing of Avatar Motion” が国際会議ACM International Conference on Multimodal Interactions (ICMI)に採録されました。
Ayaka Ideno, Takuhiro Kaneko, Tatsuya Harada, “Frame-Level Event Representation Learning for Semantic-Level Generation and Editing of Avatar Motion” ACM International Conference on Multimodal Interaction (ICMI), 2023.
https://dl.acm.org/doi/abs/10.1145/3577190.3614175
2023/7

【外部採録】竹内准特別研究員らによる量子計算の検証の研究内容が国際会議23rd Asian Quantum Information Science Conferenceに口頭発表採録されました。
Yuki Takeuchi, Yasuhiro Takahashi, Tomoyuki Morimae, and Seiichiro Tani , “Divide-and-conquer verification method for noisy intermediate-scale quantum computation,” Asian Quantim Information Science Conference (AQIS), 2023.
https://doi.org/10.22331/q-2022-07-07-758
2023/6

【外部採録】原田上席特別研究員、仁泉リサーチスペシャリスト、大石担当部長、竹内研究員、安田研究員による論文 “First-shot anomaly sound detection for machine condition monitoring: A Domain Generalization baseline” が国際会議European Signal Processing Conference (EUSIPCO) に採録されました。
Noboru Harada, Daisuke Niizumi, Yasunori Ohishi, Daiki Takeuchi, Masahiro Yasuda, “First-Shot Anomaly Sound Detection for Machine Condition Monitoring: A Domain Generalization Baseline,” European Signal Processing Conference (EUSIPCO), 2023.
DOI：10.23919/EUSIPCO58844.2023.10289721
https://ieeexplore.ieee.org/document/10289721
2023/6

【外部採録】関リサーチアソシエイト、亀岡上席特別研究員、金子特別研究員、田中研究主任、原田上席特別研究員による論文” W2N-AVSC: Audiovisual Extension For Whisper-To-Normal Speech Conversion”が国際会議 European Signal Processing Conference (EUSIPCO)に採録されました。
Shogo Seki, Kanami; Imamura, Hirokazu Kameoka, Takuhiro Kaneko, Kou Tanaka, Noboru Harada, “W2N-AVSC: Audiovisual Extension For Whisper-To-Normal Speech Conversion,” European Signal Processing Conference (EUSIPCO), 2023
DOI：10.23919/EUSIPCO58844.2023.10289823
https://ieeexplore.ieee.org/document/10289823
2023/6

【外部採録】田中研究主任、亀岡上席特別研究員、金子特別研究員による論文”PRVAE-VC: Non-parallel many-to-many voice conversion with perturbation-resistant variational autoencoder” が国際会議 ISCA Speech Synthesis Workshop (SSW) に採録されました。
Kou Tanaka, Hirokazu Kameoka, Takuhiro Kaneko, “PRVAE-VC: Non-parallel many-to-many voice conversion with perturbation-resistant variational autoencoder,” ISCA Speech Synthesis Workshop (SSW), 2023.
https://www.isca-archive.org/ssw_2023/tanaka23_ssw.html
DOI:10.21437/SSW.2023-14
2023/6

【表彰】竹内勇貴准特別研究員が情報処理学会第85回全国大会での講演「NISQ計算の分割統治による検証」について大会優秀賞を受賞しました。
情報処理学会第85回全国大会 (ipsj.or.jp)
大会優秀賞-情報処理学会 (ipsj.or.jp)
2023/5

【外部採録】国際会議Interspeech2023に12本の論文が採録されました。
・Marc Delcroix, Naohiro Tawara, Mireia Diez, Federico Landini, Anna Silnova, Atsunori Ogawa, Tomohiro Nakatani, Lukas Burget, Shoko Araki, ” Multi-Stream Extension of Variational Bayesian HMM Clustering (MS-VBx) for Combined End-to-End and Vector Clustering-based Diarization”
・Naoyuki Kamo, Marc Delcroix, Tomohiro Nakatani, ” Target Speaker Extraction with Conditional Diffusion Model”
・Shoko Araki, Ayako Yamamoto, Tsubasa Ochiai, Kenichi Arai, Atsunori Ogawa, Tomohiro Nakatani, Toshio Irino,” Impact of Residual Noise and Artifacts in Speech Enhancement Errors on Intelligibility of Human and Machine”
・Hiroshi Sato, Ryo Masumura, Tsubasa Ochiai, Marc Delcroix, Takafumi Moriya, Takanori Ashihara, Kentaro Shinayama, Saki Mizuno, Mana Ihori, Tomohiro Tanaka, Nobukatsu Hojo,” Downstream Task Agnostic Speech Enhancement Conditioned on Self-Supervised Representation Loss”
・Takafumi Moriya, Hiroshi Sato, Tsubasa Ochiai, Marc Delcroix, Takanori Ashihara, Kohei Matsuura, Tomohiro Tanaka, Ryo Masumura, Atsunori Ogawa, Taichi Asami,” Knowledge Distillation for Neural Transducer-based Target-Speaker ASR: Exploiting Parallel Mixture/Single-Talker Speech Data”
・Takanori Ashihara, Takafumi Moriya, Kohei Matsuura, Tomohiro Tanaka, Yusuke Ijima, Taichi Asami, Marc Delcroix, Yukinori Honma, ” SpeechGLUE: How Well Can Self-Supervised Speech Models Capture Linguistic Knowledge?”
・Kohei Matsuura, Takanori Ashihara, Takafumi Moriya, Tomohiro Tanaka, Takatomo Kano, Atsunori Ogawa, Marc Delcroix, ” Transfer Learning from Pre-trained Language Models Improves End-to-End Speech Summarization”
・Takuhiro Kaneko, Hirokazu Kameoka, Kou Tanaka, Shogo Seki,” iSTFTNet2: Faster and More Lightweight iSTFT-Based Neural Vocoder Using 1D-2D CNN”
・Daisuke Niizumi, Daiki Takeuchi, Yasunori Ohishi, Noboru Harada, Kunio Kashino,” Masked Modeling Duo for Speech: Specializing General-Purpose Audio Representation to Speech using Denoising Distillation”
・Kou Tanaka, Takuhiro Kaneko, Hirokazu Kameoka, Shogo Seki,” CFVC: Conditional Filtering for Controllable Voice Conversion”
・Hikaru Yanagida, Yusuke Ijima, Naohiro Tawara, "Influence of Personal Traits on Impressions of One's Own Voice"
・Yuki Kitagishi, Naohiro Tawara, Atsunori Ogawa, Ryo Masumura, Taichi Asami, "What are differences? Comparing DNN and human by their performance and characteristics in speaker age estimation"
2023/5

【外部採録】竹内准特別研究員らによる量子鍵配送の安全性解析の研究が物理学分野の主要論文誌Physical Review Research誌に採録されました。
Akihiro Mizutani, Yuki Takeuchi, Kiyoshi Tamaki, ”Finite-key security analysis of differential-phase-shift quantum key distribution”, Physical Review Research, 5, 023132 – Published 30 May 2023
Phys. Rev. Research 5, 023132 (2023) - Finite-key security analysis of differential-phase-shift quantum key distribution (aps.org)
2023/4

【外部採録】藤原特別研究員と筑波大学による論文 “Uncovering the largest community in social networks at scale” が国際会議 International Joint Conference on Artificial Intelligence (IJCAI2023) に採録されました。
Shohei Matsugu, Yasuhiro Fujiwara, Hiroaki Shiokawa, “Uncovering the Largest Community in Social Networks at Scale,” International Joint Conference on Artificial Intelligence (IJCAI2023), 2023.
https://www.ijcai.org/proceedings/2023/0250
2023/4

【外部採録】竹内准特別研究員、谷特別研究員と三菱電機との共同研究による、量子計算機の計算能力に関する研究内容が国際会議Theory of Quantum Computation, Communication and Cryptography (TQC) に口頭発表として採録されました。
Ryo Hiromasa, Akihiro Mizutani, Yuki Takeuchi, Seiichiro Tani, “Rewindable Quantum Computation and Its Equivalence to Cloning and Adaptive Postselection”
https://doi.org/10.48550/arXiv.2206.05434
2023/3

【外部採録】慶應義塾大学と木村主幹研究員による論文 ”Listening human behavior: 3D human pose estimation with acoustic signals“ が国際会議 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR2023) に採録されました。
Yuto Shibata, Yutaka Kawashima, Mariko Isogawa, Go Irie, Akisato Kimura, Yoshimitsu Aoki, “Listening human behavior: 3D human pose estimation with acoustic signals,” IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2023.
https://openaccess.thecvf.com/content/CVPR2023/html/Shibata_Listening_Human_Behavior_3D_Human_Pose_Estimation_With_Acoustic_Signals_CVPR_2023_paper.html
2023/3

【外部採録】人間情報研究所と金子特別研究員による論文 “Unsupervised intrinsic image decomposition with LiDAR intensity” が国際会議 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR2023) に採録されました。
Shogo Sato, Yasuhiro Yao, Taiga Yoshida, Takuhiro Kaneko, Shingo Ando, Jun Shimamura, “Unsupervised intrinsic image decomposition with LiDAR intensity,” IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2023.
https://openaccess.thecvf.com/content/CVPR2023/html/Sato_Unsupervised_Intrinsic_Image_Decomposition_With_LiDAR_Intensity_CVPR_2023_paper.html
2023/3

【表彰】2023　AI 2000 Most Influential Scholar Honorable Mention in Speech Recognition
中谷上席特別研究員、デルクロア特別研究員が表彰されました。
https://www.aminer.cn/ai2000
2023/2

【外部採録】国際会議 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2023) に 9本の論文が採録されました。
・Xiaomeng Wu, Yongqing Sun, Akisato Kimura, “Deep quantigraphic image enhancement via comparametric equations.”
・Atsunori Ogawa, Takafumi Moriya, Naoyuki Kamo, Naohiro Tawara, Marc　Delcroix,　“Iterative shallow fusion of backward language model for end-to-end speech recognition”
・Takatomo Kano, Atsunori Ogawa, Marc Delcroix, Roshan Sharma, Kohei Matsuura, Shinji Watanabe, “Speech summarization of long spoken document: Improving memory efficiency of speech/text encoders”
・Kohei Matsuura, Takanori Ashihara, Takafumi Moriya, Tomohiro Tanaka, Atsunori Ogawa, Marc Delcroix, Ryo Masumura, “LEVERAGING LARGE TEXT CORPORA FOR END-TO-END SPEECH SUMMARIZATION”
・Thilo von Neumann, Christoph Boeddeker, Keisuke Kinoshita, Marc Delcroix, Reinhold Haeb-Umbach, “On Word Error Rate Definitions and their Efficient Computation for Multi-Speaker Speech Recognition Systems”
・Taishi Nakashima, Rintaro Ikeshita, Nobutaka Ono, Shoko Araki, Tomohiro Nakatani, ” Fast Online Source Steering Algorithm for Tracking Single Moving Source Using Online Independent Vector Analysis”
・Shogo Seki, Hirokazu Kameoka, Kou Tanaka, Takuhiro Kaneko, ” JSV-VC: JOINTLY TRAINED SPEAKER VERIFICATION AND VOICE CONVERSION MODELS”
・Daisuke Niizumi, Daiki Takeuchi, Yasunori Ohishi, Noboru Harada, Kunio Kashino,” Masked modeling duo: Learning Representations by Encouraging Both Networks to Model the Input”
・Takuhiro Kaneko, Hirokazu Kameoka, Kou Tanaka, Shogo Seki,” Wave-U-Net Discriminator: Fast and Lightweight Discriminator for Generative Adversarial Network-Based Speech Synthesis”
2023/2

【外部採録】武主任研究員、木村主幹研究員、柏野上席特別研究員および九州大学による Deep attentive time warping が論文誌 Pattern Recognition に採録されました。
Shinnosuke Matsuo, Xiaomeng Wu, Guntag Atarsaikhan, Akisato Kimura, Kunio Kashino, Brian Kenji Iwana, Seiichi Uchida, “Deep attentive time warping,” Pattern Recognition, 2023.
https://doi.org/10.1016/j.patcog.2022.109201
2023/2

【外部採録】落合研究員、デルクロア特別研究員，NTT人間情報研究所および東京工業大学による目的話者のE2E音声認識に関する論文がIEEE Accessに採録されました。
T. Moriya, H. Sato, T. Ochiai, M. Delcroix and T. Shinozaki, "Streaming End-to-End Target-Speaker Automatic Speech Recognition and Activity Detection," in IEEE Access, 2023. doi: 10.1109/ACCESS.2023.3243690.
https://ieeexplore.ieee.org/document/10041133
2023/2

【外部採録】石川研究員および早稲田大学による論文 “Determination of microphone acoustic center from sound field projection measured by optical interferometry” が論文誌 The Journal of the Acoustical Society of Americaに採録されました。
Denny Hermawanto, Kenji Ishikawa, Kohei Yatabe, Yasuhiro Oikawa, “Determination of microphone acoustic center from sound field projection measured by optical interferometry,” The Journal of the Acoustical Society of America, 2023.
https://doi.org/10.1121/10.0017246 J. Acoust. Soc. Am. 153, 1138–1146 (2023)
2023/2

【外部採録】白木主任研究員、佐藤主任研究員、守谷フェローおよび長岡技術科学大学による論文 “I/Q Demodulator based Optical Camera Communication” が論文誌IEEE Photonics Journalに採録されました。
Hiroaki Matsunaga, Tomohiro Yendo, Wataru Kihara, Yoshifumi Shiraki, Takashi G. Sato, Takehiro Moriya, “I/Q Demodulator Based Optical Camera Communications,” IEEE Photonics Journal, 2023.
June 2022 IEEEPhotonics Journal 14(3):1-1
DOI:10.1109/JPHOT.2022.3166283
2023/2

【外部採録】佐藤主任研究員,白木担当課長らによる論文 “Decoding Selective Attention from EEG during Simultaneous Presentation of Two Melodies” が国際会議Neuroscience 2021に採録されました。
2023/2

【表彰】谷誠一郎特別研究員と群馬大学の高橋康博准教授（元NTTコミュニケーション科学基礎研究所）が第６８回（令和４年度）の前島密賞を受賞することになりました。
https://www.tsushinbunka.org/pdf/maejima/r04jushousha.pdf
2023/1

【外部採録】藤原特別研究員，中野主任研究員，木村主幹研究員，上田フェローおよびNTTコンピュータ&データサイエンス研究所による論文 ”Efficient Network Representation Learning via Cluster Similarity”が International Conference on Database Systems for Advanced Applications (DASFAA) に採録されました。
Yasuhiro Fujiwara, Yasutoshi Ida, Atsutoshi Kumagai, Masahiro Nakano, Akisato Kimura, Naonori Uede, “Efficient Network Representation Learning via Cluster Similarity,” in Proc. International Conference on Database Systems for Advanced Applications (DASFAA), 2023.
2023/1

【外部採録】デルクロア特別研究員とPaderborn大学との共同研究による、会話音声の音源分離手法Graph-PITの新しい学習方法に関する論文が IEEE/ACM Transactions on Audio, Speech and Language Processing 誌に採録されました。
T. von Neumann, K. Kinoshita, C. Boeddeker, M. Delcroix and R. Haeb-Umbach, "Segment-less Continuous Speech Separation of Meetings: Training and Evaluation Criteria," in IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2023, doi: 10.1109/TASLP.2022.3228629.
https://ieeexplore.ieee.org/abstract/document/9982413
2023/1

【外部採録】デルクロア特別研究員、落合研究員、木下特別研究員による目的話者抽出についてのOverview論文が、IEEE Signal Processing Magazineに採録されました。
Katerina Zmolikova, Marc Delcroix, Tsubasa Ochiai, Keisuke Kinoshita, Jan Cernocky, Dong Yu, "Neural target speech extraction: An overview," IEEE Signal Processing Magazine, 2023. DOI: 10.1109/MSP.2023.3240008.
https://ieeexplore.ieee.org/abstract/document/10113382
2023/1

【外部採録】落合研究員、デルクロア特別研究員、中谷上席特別研究員、荒木主幹研究員による話者移動を扱えるBeamformerについての論文が、IEEE/ACM Transactions on Audio Speech and Language Processingに採録されました。
Tsubasa Ochiai, Marc Delcroix, Tomohiro Nakatani, Shoko Araki, ”Mask-based Neural Beamforming for Moving Speakers with Self-Attention-based Tracking," IEEE/ACM Transactions onAudio Speech and Language Processing, 2023, DOI: 10.1109/TASLP.2023.3237172.
https://ieeexplore.ieee.org/document/10017367
2023/1

【外部採録】グエンリサーチアソシエイト、白木担当課長、石川研究員、村松研究主任、原田上席特別研究員、守谷フェローによる，可視光通信のためのRegion of Interest (RoI)シグナリングにおいて低レート信号のビット列と高レート信号のビット列の出力確率を制御する2値分布マッチング手法を提案した論文が、IEEE Photonics Journalに採録されました。
Phuc Duc Nguyen, Yoshifumi Shiraki, Kenji Ishikawa, Jun Muramatsu, Noboru Harada, Takehiro Moriya, “Distribution matching for dimming control in visible-light region-of-interest signaling,” IEEE Photonics Journal, 2023. DOI: 10.1109/JPHOT.2022.3233092
2023/1

【外部採録】柏野上席特別研究員と名古屋大学による観衆の顔向きの時空間統合による注目対象の位置及び被注目度の推定が電子情報通信学会論文誌に採録されました。
武田一馬，川西康友，平山高嗣，出口大輔，井手一郎，村瀬洋，柏野邦夫，”観衆の顔向きの時空間統合による注目対象の位置及び被注目度の推定,” 電子情報通信学会論文誌， J106-A, No.3, pp.58-69, 2023.
https://search.ieice.org/bin/summary.php?id=j106-a_3_58&category=-A&year=2023&lang=J&abst=
2023/1

【表彰】俵直弘研究主任が、The 2022 IEEE Spoken Language Technology Workshop (SLT 2022) で、Best reviewer awardを受賞しました。
https://www.slt2022.org/best-papers.php

2022

2022/10/28

【受賞】竹内勇貴研究員が第17回（2023年）日本物理学会若手奨励賞を受賞しました。
業績「測定型量子計算を用いた量子超越性の実証と検証に関する理論的研究」

https://www.jps.or.jp/activities/awards/jusyosya/wakate2023.php
2022/04/22

【受賞】竹内勇貴研究員が第5回量子ソフトウェア研究発表会にて優秀発表賞を受賞しました。
業績「NISQ計算の分割統治による検証」

https://www.ipsj.or.jp/award/qs-award1.html

2021

2021/03/11

【受賞】落合翼研究員が第16回日本音響学会独創研究奨励賞板倉記念を受賞しました。
業績「マイクロホンアレイ信号処理と音声認識の統合的最適化」

https://acoustics.jp/awards/itakura/
2021/02/18

【受賞】亀岡弘和上席特別研究員が東北大学電気通信研究所 2020年度(第10 回) RIEC Award を受賞しました。
業績「音響信号の要素分解と情景分析」

https://www.riec.tohoku.ac.jp/ja/info/riec-award/r2/
2021/01/28

池下林太郎研究員が第49回日本音響学会粟屋潔学術奨励賞を受賞しました。
受賞論文：池下林太郎, 中谷智広 "分離行列の乗算更新によるブラインド音源分離," 日本音響学会2020年秋季研究発表会, 1-1-13, 2020.
2021/01/21

クリシュナオンカー研究員、入江豪特別研究員、武小萌主任研究員、川西隆仁主幹研究員、柏野邦夫上席特別研究員が第26回画像センシングシンポジウムにて、優秀学術賞を受賞しました。
優秀学術賞受賞論文：クリシュナオンカー, 入江豪, 武小萌, 川西隆仁, 柏野邦夫 "適応的スポッティング：深層強化学習に基づく3D点群物体探索," 第26回画像センシングシンポジウム, 2020.