2024
-
2024/12
【表彰】森谷准特別研究員、俵主任研究員、デルクロア特別研究員およびNTT人間情報研究所との混合音声を対象とした話者埋め込み抽出に関する共同研究成果 “Recursive Attentive Pooling for Extracting Speaker Embeddings from Multi-Speaker Recordings”が、国際会議 IEEE Spoken Language Technology Workshop 2024 (SLT2024) で、Best paper honorable mentionを受賞しました。
https://ieeexplore.ieee.org/document/10832241 -
2024/12
【外部採録】 国際会議 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2025)に、メディア情報研究部から、20本の論文が採録されました。
https://group.ntt/jp/topics/2025/03/31/icassp2025.html
・Yuto Kondo, Hirokazu Kameoka, Kou Tanaka, Takuhiro Kaneko, "Core Aggregation via Quantized Distribution Fitting and ITS Application to Predictor Learning"
・Binh Thien Nguyen, Daiki Takeuchi, Masahiro Yasuda, Daisuke Niizumi, Noboru Harada, "Negative and Balanced Sampling for Language-query Audio Source Separation"
・Stefan Bruhn, Tomas Toftgår, Stefan Döhla, Huan-yu Su, Lasse Laaksonen, Takehiro Moriya, Stéphane Ragot, Hiroyuki Ehara, Marek Szczerba, Imre Varga, Andrey Schevciw, Milan Jerinec, "3GPP IVAS Codec – Perspectives on Development, Testing and Standardization"
・Takehiro Moriya, Stephane Ragot, Arnaud Lefort, Alexandre Guerin, Noboru Harada, Ryosuke Sugiura, Yutaka Kamamoto, "EVS-Compatible Downmix in 3GPP IVAS"
・Masahiro Nakano, Hiroki Sakuma, Ryo Nishikimi, Kenji Komiya, Tomoharu Iwata, Kunio Kashino, "Hyperbolic PHATE: Visualizing Continuous Hierarchy of Latent Differentiation Structures"
・Nao Sato, Masahiro Yasuda, Shoichiro Saito, Noboru Harada, "Sound Source Distance Estimation Utilizing Physics-informed Prior for Sound Event Localization and Detection"
・Masahiro Yasuda, Shoichiro Saito, Nao Sato, Noboru Harada, "Spatial Annotation-free Training for Sound Event Localization and Detection"
・Junpei Honma, Akisato Kimura, Go Irie, "Multi-Task Learning for Ultrasonic Echo-based Depth Estimation with Audible Frequency Recovery"
・Tomohiro Nakatani, Naoyuki Kamo, Marc Delcroix, Shoko Araki, "A Hybrid Probabilistic-Deterministic Model Recursively Enhancing Speech"
・Naohiro Tawara, Atsushi Ando, Shota Horiguchi, and Marc Delcroix, "Multi-channel Speaker Counting for EEND-VC-based Speaker Diarization on Multi-domain Conversation"
・Takatomo Kano, Atsunori Ogawa, Marc Delcroix, William Chen, Ryo Fukuda, Kohei Matsuura, Takanori Ashihara, Shinji Watanabe, "Bridging Speech and Text Foundation Models with ReShape Attention"
・Ryo Fukuda, Takatomo Kano, Atushi Ando, Atunori Ogawa, "Whisper-ER: Speech Emotion Recognition Based on Large-Scale Automatic Speech Recognizer"
・Shoko Araki, Nobutaka Ito, Reinhold Haeb-Umbach, Gordon Wichern, Zhong-Qiu Wang, Yuki Mitsufuji, "30+ Years of Source Separation Research: Achievements and Future Challenges"
・Takafumi Moriya, Shota Horiguchi, Marc Delcroix, Ryo Masumura, Takanori Ashihara, Hiroshi Sato, Kohei Matsuura, Masato Mimura, "Alignment-Free Training for Transducer-based Multi-Talker ASR"
・Carlos Hernandez-Olivan, Marc Delcroix, Tsubasa Ochiai, Daisuke Niizumi, Naohiro Tawara, Tomohiro Nakatani, Shoko Araki, "SoundBeam meets M2D: Target Sound Extraction with Audio Foundation Model"
・Alexis Plaquet, Naohiro Tawara, Marc Delcroix, Atsushi Ando, Shota Horiguchi, Shoko Araki, "Mamba-based Segmentation Model for Speaker Diarization"
・Junyi Peng, Takanori Ashihara, Marc Delcroix, Tsubasa Ochiai, Oldrich Plchot, Shoko Araki, Jan Cernock, "TS-SUPERB: A Target Speech Processing Benchmark for Speech Self-Supervised Learning Models"
・Shota Horiguchi, Takafumi Moriya, Atsushi Ando, Takanori Ashihara, Hiroshi Sato, Naohiro Tawara, Marc Delcroix, "Guided Speaker Embedding"
・Tsubasa Ochiai, Kazuma Iwamoto, Marc Delcroix, Rintaro Ikeshita, Hiroshi Sato, Shoko Araki, "Rethinking Processing Distortions: Disentangling the Impact of Speech Enhancement Errors on Speech Recognition Performance" (Journal Paper Presentation)
・Daisuke Niizumi, Daiki Takeuchi, Yasunori Ohishi, Noboru Harada, Kunio Kashino, "Masked Modeling Duo: Towards Universal Audio Pre-training Framework" (Journal Paper Presentation) -
2024/11
【外部採録】国際会議 IEEE/CVF Winter Conference on Applications of Computer Vision (WACV2025) に2本の論文が採録されました。
・Shogo Sato, Takuhiro Kaneko, Kazuhiko Murasaki, Taiga Yoshida, Ryuichi Tanida, Akisato Kimura, " Unsupervised Single-Image Intrinsic Image Decomposition With LiDAR Intensity Enhanced Training"
・Risako Tanigawa, Kenji Ishikawa, Noboru Harada, Yasuhiro Oikawa, " SoundSil-DS: Deep Denoising and Segmentation of Sound-Field Images with Silhouettes" -
2024/11
【外部採録】石川研究主任らによる「Sound Field Reconstruction Using Optical Sound Measurement and Neural Fields」が国際会議IEEE International Workshop on Machine Learning for Signal Processing(MLSP2024)に採録されました。
-
2024/11
【外部採録】竹内准特別研究員らによる論文「Direct Moment Estimation of Intensity Distribution of Magnetic Fields with Quantum Sensing Network」が論文誌New Journal of Physicsに採録されました。
https://iopscience.iop.org/article/10.1088/1367-2630/ad93f4 -
2024/11
【外部採録】ブストス研究主任らによる論文「Wolstenholme Primes and Group Determinants of Cyclic Groups」が論文誌Proceedings of the Japan Academy, Ser. Aに採録されました。
https://projecteuclid.org/journals/proceedings-of-the-japan-academy-series-a-mathematical-sciences/volume-100/issue-9/Wolstenholme-primes-and-group-determinants-of-cyclic-groups/10.3792/pjaa.100.011.full?tab=ArticleLink -
2024/11
【表彰】三鼓研究員、木村主席研究員および東京理科大学、京都大学らによる「Cross-Action Cross-Subject Skeleton Action Recognition Via Simultaneous Action-Subject Learning with Two-Step Feature Removal」が国際会議 IEEE International Conference on Image Processing (ICIP2024)において Best Paper Award 1st Runner-up を受賞しました。
https://ieeexplore.ieee.org/document/10647253
https://group.ntt/jp/topics/2025/01/14/icip2024.html -
2024/10
【外部採録】国際会議Asia Pacific Signal and Information Processing Association (APSIPA) Annual Summit and Conference (APSIPA ASC2024)に2本の論文が採録されました。
・Chihiro Watanabe, Hirokazu Kameoka, "GE2E-AC: Generalized End-to-End Loss Training for Accent Classification"
・Xiao Zhang, Haoran Xing, Mingxue Song, Daiki Takeuchi, Noboru Harada, Shoji Makino, "Prediction-Error-Based Adaptive SpecAugment for Fine-Tuning the Masked Model on Audio Classification Tasks" -
2024/10
【外部採録】竹内准特別研究員らによる論文「Rewindable Quantum Computation and Its Equivalence to Cloning and Adaptive Postselection」が論文誌Theory of Computing Systemsに採録されました。
https://link.springer.com/article/10.1007/s00224-024-10208-5 -
2024/9
【外部採録】中谷上席特別研究員、デルクロア特別研究員、落合研究主任およびPaderborn大学との論文「Microphone Array Signal Processing and Deep Learning for Speech Enhancement」がIEEE Signal Processing Magazine に掲載されました。
https://ieeexplore.ieee.org/document/10819706 -
2024/9
【外部採録】中谷上席特別研究員、池下研究主任、荒木主幹研究員および早稲田大学との論文「DOA-Informed Switching Independent Vector Extraction and Beamforming for Speech Enhancement in Underdetermined Situations」 がEURASIP Journal on Audio, Speech, and Music Processing 誌に採録されました。
https://asmp-eurasipjournals.springeropen.com/articles/10.1186/s13636-024-00373-3 -
2024/9
【外部採録】仁泉リサーチスペシャリスト、竹内研究員、大石主幹研究員, 原田上席特別研究員、柏野フェローによる論文「Masked Modeling Duo: Towards Universal Audio Pre-Training Framework」がIEEE Transactions on Audio, Speech and Language Processing(TASLP)誌に採録されました。
https://ieeexplore.ieee.org/document/10502167 -
2024/9
【外部採録】仁泉リサーチスペシャリスト、竹内研究員、大石主幹研究員, 原田上席特別研究員、柏野フェローによる論文「Exploring Pre-Trained General-Purpose Audio Representations for Heart Murmur Detection」が国際会議IEEE Engineering in Medicine and Biology Society(EMBC2024)に採録されました。
https://arxiv.org/pdf/2404.17107 -
2024/9
【外部採録】国際会議Detection and Classification of Acoustic Scenes and Events(DCASE)2024 Workshopに3本の論文が採録されました。
・Daiki Takeuchi, Masahiro Yasuda, Daisuke Niizumi, Noboru Harada, "Towards Learning a Difference-Aware General-Purpose Audio Representation"
・Tomoya Nishida, Noboru Harada, Daisuke Niizumi, Davide Albertini, Roberto Sannino, Simone Pradolini, Filippo Augusti, Keisuke Imoto, Kota Dohi, Harsh Purohit, Takashi Endo, Yohei Kawaguchi, "Description and Discussion on DCASE 2024 Challenge Task 2: First-Shot Unsupervised Anomalous Sound Detection for Machine Condition Monitoring"
・Daisuke Niizumi, Noboru Harada, Yasunori Ohishi, Daiki Takeuchi, Masahiro Yasuda, "ToyADMOS2#: Yet Another Data for the DCASE2024 Challenge Task 2 First-Shot Anomalous Sound Detection" -
2024/9
【外部採録】秋笛研究主任による論文「Probabilistic Unitary and State Synthesis with Optimal Accuracy」が国際会議6th International Workshop on Quantum Compilation (IWQC2024) に採録され、講演を実施しました。
https://dl.acm.org/doi/pdf/10.1145/3663576 -
2024/9
【外部採録】ブストス研究主任と若山リサーチプロフェッサらによる論文「Zeta Limits for The Spectrum of Quantum Rabi Models」が論文誌Journal of Mathematical Physicsに採録されました。
https://arxiv.org/pdf/2304.08943 -
2024/7
【外部採録】落合研究主任、デルクロア特別研究員、池下研究主任、荒木主幹研究員らによる論文「Rethinking Processing Distortions: Disentangling the Impact of Speech Enhancement Errors on Speech Recognition Performance」がIEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP)誌に採録されました。
https://ieeexplore.ieee.org/document/10606400 -
2024/7
【外部採録】木村主席研究員による論文「Acoustic-Based 3D Human Pose Estimation Robust to Human Position」がコンピュータビジョン分野の国際会議The British Machine Vision Conference(BMVC2024)に採録されました。
https://bmva-archive.org.uk/bmvc/2024/papers/Paper_135/paper.pdf -
2024/7
【外部採録】デルクロア特別研究員およびNTT人間情報研究所らによる論文「Unveiling the Linguistic Capabilities of a Self-Supervised Speech Model Through Cross-Lingual Benchmark and Layer-Wise Similarity Analysis」がIEEE Access誌に採録されました。
https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=10597571 -
2024/7
【外部採録】小川主任研究員と豊橋技科大学との共同研究成果「Recognition of Target Domain Japanese Speech Using Language Model Replacement」がEuropean Association for Signal Processing (EURASIP)Journalに採録されました。
https://asmp-eurasipjournals.springeropen.com/articles/10.1186/s13636-024-00360-8 -
2024/7
【外部採録】佐野研究主任らよる論文「Northcott Numbers for Generalized Weighted Weil Heights」が論文誌Acta Arithmeticaに採録されました。
https://arxiv.org/pdf/2308.03981 -
2024/7
【外部採録】竹内准特別研究員らによる論文「Finite-Key Security of Differential-Phase-Shift QKD」が国際会議Asian Quantum Information Science Conference(AQIS2024)に採録されました。
-
2024/7
【外部採録】ブストス研究主任と若山リサーチプロフェッサらによる論文「Spacing Distribution for Quantum Rabi Models」が論文誌Journal of Physics A: Mathematical and Theoreticalに採録されました。
https://arxiv.org/pdf/2310.09811 -
2024/7
【外部採録】色川リサーチアシスタントによる論文「Activity Measures of Dynamical Systems Over Non-Archimedean Fields」が論文誌Discrete and Continuous Dynamical Systems に採録されました。
https://arxiv.org/pdf/1901.01075 -
2024/6
【外部採録】国際会議Interspeech2024に7本の論文が採録されました。
・Kohei Matsuura, Takanori Ashihara, Takafumi Moriya, Tomohiro Tanaka, Masato Mimura, Takatomo Kano, Atsunori Ogawa, Marc Delcroix, Taichi Asami, " Sentence-wise Speech Summarization: Task, Datasets, and End-to-End Modeling with LM Knowledge Distillation"
・Hiroshi Sato, Takafumi Moriya, Masato Mimura, Shota Horiguchi, Tsubasa Ochiai, Takanori Ashihara, Atsushi Ando, Kentaro Shinayama, Marc Delcroix, "SpeakerBeam-SS: Real-time Target Speaker Extraction with Lightweight Conv-TasNet and State Space Modeling"
・Kenichi Fujita, Takanori Ashihara, Marc Delcroix, Yusuke Ijima, " Lightweight Zero-shot Text-to-Speech with Mixture of Adapters"
・Marvin Tammen, Tsubasa Ochiai, Marc Delcroix, Tomohiro Nakatani, Shoko Araki, Simon Doclo, "Array Geometry-Robust Attention-Based Neural Beamformer for Moving Speakers"
・Takuhiro Kaneko, Hirokazu Kameoka, Kou Tanaka, Yuto Kondo, " FastVoiceGrad: One-step Diffusion-Based Voice Conversion with Adversarial Conditional Diffusion Distillation”
・Kou Tanaka, Hirokazu Kameoka, Takuhiro Kaneko, Yuto Kondo, “PRVAE-VC2: Non-Parallel Voice Conversion by Distillation of Speech Representations”
・Daisuke Niizumi, Daiki Takeuchi, Yasunori Ohishi, Noboru Harada, Masahiro Yasuda, Shunsuke Tsubaki, Keisuke Imoto, "M2D-CLAP: Masked Modeling Duo Meets CLAP for Learning General-purpose Audio-Language Representation" -
2024/6
【外部採録】国際会議European Signal Processing Conference(EUSIPCO2024)に2本の論文が採録されました。
・Yuto Kondo, Hirokazu Kameoka, Kou Tanaka, Takuhiro Kaneko, Noboru Harada, “Learning to Assess Subjective Impressions Conveyed Through Speech”
・Shunsuke Tsubaki, Daisuke Niizumi, Daiki Takeuchi, Yasunori Ohishi, Noboru Harada, Keisuke Imoto, “Refining Knowledge Transfer on Audio-Image Temporal Agreement for Audio-Text Cross Retrieval” -
2024/6
【外部採録】金子特別研究員が画像電子学会のAdvanced Image Seminar (AIS2024)において「深層生成モデルの基礎と応用」の学術講演を実施しました。
-
2024/5
【外部採録】柏野フェロー、木村主席研究員らによる「Detection of Acute Myeloid Leukemia without Labeling Individual Blood Cells」が国際会議IEEE Engineering in Medicine and Biology Society(EMBC2024)に採録されました。
-
2024/5
【外部採録】秋笛研究主任、情報通信研究機構、早稲田大学らによる論文「Probabilistic Unitary Synthesis with Optimal Accuracy」が論文誌ACM Transactions on Quantum Computingに採録されました。
https://arxiv.org/html/2301.06307v2 -
2024/5
【外部採録】秋笛研究主任と立命館大学による論文「Non-locality of Conjugation Symmetry: Characterization and Examples in Quantum Network Sensing」が論文誌New Journal of Physicsに採録されました。
https://arxiv.org/html/2309.12523v2 -
2024/4
【外部採録】IEEE/ACM Transactions on Audio, Speech, and Language Processing(IEEE/ACM Trans. ASLP)に2本の論文が採録されました。
・Hirokazu Kameoka, Takuhiro Kaneko, Kou Tanaka, Nobukatsu Hojo, Shogo Seki, "VoiceGrad: Non-Parallel Any-to-Many Voice Conversion with Annealed Langevin Dynamics"
・Daisuke Niizumi, Daiki Takeuchi, Yasunori Ohishi, Noboru Harada, Kunio Kashino, "Masked Modeling Duo: Towards a Universal Audio Pre-training Framework" -
2024/4
【外部採録】琉球大学と若山正人リサーチプロフェッサによる論文「Partition Functions for Non-commutative Harmonic Oscillators and Related Divergent Series」が論文誌Indagationes Mathematicaeに採録されました。
https://www.sciencedirect.com/science/article/abs/pii/S0019357724000612?via%3Dihub -
2024/4
【外部採録】論文集Mathematical Foundations for Post-Quantum Cryptographyに2本の論文が採録されました。
・Ryosuke Nakahama, “Representation Theory of sl(2,R)=su(1,1) and a Generalization of Non-commutative Harmonic Oscillators”
・Cid Reyes-Bustos, “Towards Hash Functions Based on Group-subgroup Pair Graphs” -
2024/3
【外部採録】国際会議 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2024)に2本の論文が採録されました。
・Yu Mitsuzumi, Akisato Kimura, Hisashi Kashima, "Understanding and Improving Source-free Domain Adaptation from a Theoretical Perspective"
・Takuhiro Kaneko, "Improving Physics Augmented Continuum Neural Radiance Fileds-Based Geometry-Agnostic System Identification with Lagrangian Particle Optimization" -
2024/3
【外部採録】池下研究主任、中谷上席研究員による” Geometrically-Regularized Fast Independent Vector Extraction by Pure Majorization-Minimization”がIEEE Transactions on Signal Processing誌に採録されました。
https://ieeexplore.ieee.org/document/10466407 -
2024/2
【外部採録】国際会議 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2024) 併設のワークショップに5本の論文が採録されました。
・Junyi Peng, Marc Delcroix, Tsubasa Ochiai, Oldrich Plchot, Takanori Ashihara, Shoko Araki, Jan Cernocky, "Probing Self-supervised Learning Models with Target Speech Extraction"
・Thilo von Neumann, Christoph Boeddeker, Tobias Cord-Landwehr, Marc Delcroix, Reinhold Haeb-Umbach, "Meeting Recognition with Continuous Speech Separation and Transcription-Supported Diarization"
・Rino Kimura, Tomohiro Nakatani, Naoyuki Kamo, Marc Delcroix, Shoko Araki, Tetsuya Ueda, Shoji Makino, "Diffusion model-based MIMO speech denoising and dereverberation"
・Hao Shi, Naoyuki Kamo, Marc Delcroix, Tomohiro Nakatani and Shoko Araki, "ENSEMBLE INFERENCE FOR DIFFUSION MODEL-BASED SPEECH ENHANCEMENT"
・Bo He, Shiqi Zhang, Xianrui Wang, Zheng Qiu, Daiki Takeuchi, Daisuke Niizumi, Noboru Harada, Shoji Makino, “Light Gated Multi Mini-patch Extractor for Audio Classification”
また,ICASSP2024 Show & Tell Demos に2本の論文が採択されました.
・Yasunori Ohishi, Marc Delcroix, Tsubasa Ochiai, Shoko Araki, Daiki Takeuchi, Daisuke Niizumi, Akisato Kimura, Noboru Harada, Kunio Kashino “Target Speech Spotting and Extraction Based on ConceptBeam”
・Thilo von Neumann, Christoph Boeddeker, Marc Delcroix, Reinhold Haeb-Umbach, "MeetEval, Show Me the Errors! Interactive Visualization of Transcript Alignments for the Analysis of Conversational ASR" -
2024/2
【外部採録】中野特別研究員、佐久間研究員、錦見研究員、渋江研究員、佐藤主任研究員、岩田上席特別研究員、柏野フェローによる“Warped Diffusion for Latent Differentiation Inference”がInternational Conference on Artificial Intelligence and Statistics (AISTATS2024)に採択されました。
https://proceedings.mlr.press/v238/nakano24a.html -
2024/1
【外部採録】宮﨑研究主任と東京大学によるモチーフ理論についての論文”A motivic construction of the de Rham-Witt complex”がJournal of Pure and Applied Algebraに採録されました。
https://www.sciencedirect.com/science/article/pii/S0022404923002840 -
2024/1
【表彰】落合翼研究主任が第8回 IEEE Signal Processing Society (SPS) Japan Young Author Best Paper Award を受賞しました。
https://www.ieee-jp.org/section/tokyo/chapter/SP-01/sp.htm#HYOUSHOU -
2024/1
【表彰】谷特別研究員による「量子計算機アルゴリズムの先駆的研究を通じた耐量子計算機暗号技術の安全性評価への貢献」が2023年度SCAT表彰会長賞を受賞しました。
https://www.scat.or.jp/cms/wp-content/uploads/2023/12/award-press2023.pdf