篠田浩一研究業績一覧 | T2R2 東京科学大学リサーチリポジトリ

ヘルプ

篠田浩一研究業績一覧 (487件)

論文

Pablo Cervantes, Yusuke Sekikawa, Ikuro Sato, Koichi Shinoda. Integrating Generative and Contrastive Approaches for Human Action Recognition, IEEE Access, IEEE, vol. 13, pp. 100095-100104, June 2025. 公式リンク
Ruoyue Shen, Nakamasa Inoue, Dayan Guan, Rizhao Cai, Alex.C Kot, Koichi Shinoda. ContextualCoder: Adaptive In-context Prompting for Programmatic Visual Question Answering, IEEE Transactions on Multimedia, IEEE, pp. 1-14, Feb. 2025. 公式リンク
Shuji Komeiji, Takumi Mitsuhashi, Yasushi Iimura, Hiroharu Suzuki, Hidenori Sugano, Koichi Shinoda, Toshihisa Tanaka. Feasibility of decoding covert speech in ECoG with a Transformer trained on overt speech, Scientific Reports, Springer Nature, 14, May 2024. 公式リンク
Yuzhe Hao, Asako Kanezaki, Ikuro Sato, Rei Kawakami, Koichi Shinoda. Egocentric Human Activities Recognition With Multimodal Interaction Sensing, IEEE Sensors Journal, IEEE, Vol. 24, No. 5, 7085 - 7096, Mar. 2024.
Mitali, Shuji Komeiji, Takumi Mitsuhashi, Yasushi Iimura, Hiroharu Suzuki, Hidenori Sugano, Koichi Shinoda, Toshihisa Tanaka. Multimodal recognition of speech and electrocorticogram, Asia Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2023, 2023 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), IEEE, pp. 546-550, Nov. 2023. 公式リンク
Mariana RODRIGUES MAKIUCHI, Tifani WARNITA, Nakamasa INOUE, Koichi SHINODA, Michitaka YOSHIMURA, Momoko KITAZAWA, Kei FUNAKI, Yoko EGUCHI, Taishiro KISHIMOTO. Speech Paralinguistic Approach for Detecting Dementia Using Gated Convolutional Neural Network, IEICE TRANSACTIONS on Information and Systems, The Institute of Electronics, Information and Communication Engineers, Vol. E104-D, No. 11, pp. 1930-1940, Nov. 2021.
Taishiro Kishimoto, Akihiro Takamiya, Kuo-ching Liang, Kei Funaki, Takanori Fujita, Momoko Kitazawa, Michitaka Yoshimura, Yuki Tazawa, Toshiro Horigome, Yoko Eguchi, Toshiaki Kikuchi, Masayuki Tomita, Shogyoku Bun, Junichi Murakami, Brian Sumali, Tifani Warnita, Aiko Kishi, Mizuki Yotsui, Hiroyoshi Toyoshiba, Yasue Mitsukura, Koichi Shinoda, Yasubumi Sakakibara, Masaru Mimura, on behalf of the PROMPT collaborators. The project for objective measures using computational psychiatry technology (PROMPT): Rationale, design, and methodology, Contemporary Clinical Trials Communications, Elsevier Inc, Aug. 2020.
Kong Aik Lee, Hitoshi Yamamoto, Koji Okabe, Qiongqiong Wang, Ling Guo, Takafumi Koshinaka, Jiacen Zhang, Koichi Shinoda. NEC-TT System for Mixed-Bandwidth and Multi-Domain Speaker Recognition, Computer Speech and Language, Elsevier Ltd., Volume 61, Nov. 2019.
Taichi Asami, Ryo Masumura, Yushi Aono, Koichi Shinoda. Recurrent out-of-vocabulary word detection based on distribution of features, Computer speech & language, Elsevier Ltd., Volume 58, Page 247-259, May 2019.
Tommi Kerola, Nakamasa Inoue, Koichi Shinoda. Cross-View Human Action Recognition from Depth Maps Using Spectral Graph Sequences, Elsevier Journal of Computer Vision and Image Understanding (CVIU), ElsevierInc., vol. 154, pp. 108-126, Jan. 2017. 公式リンク
Martin Drahansky, Ondrej Kanich, Eva Brezinova, Koichi Shinoda. Experiments with Optical Properties of Skin on Fingers, International Journal of Optics and Applications, International Journal of Optics and Applications, vol. 6, no. 2, pp. 37-46, Oct. 2016. 公式リンク
Nakamasa Inoue, Koichi Shinoda. Semantic Indexing for Large-Scale Video Retrieval, ITE Transactions on Media Technology and Applications, vol. 4, no. 3, pp. 209-217, July 2016.
Ryan Price, Kenichi Iso, Koichi Shinoda. Wise Teachers Train Better DNN Acoustic Models, EURASIP Journal on Audio Speech and Music Processing, Springer International Publishing Ltd, 10, pp. 1-19, Apr. 2016. 公式リンク
Yuan Liang, Koji Iwano, Koichi Shinoda. Error Correction Using Long Context Match for Smartphone Speech Recognition, IEICE Transactions on Information and Systems, IEICE, vol. E98-D, no. 11, pp. 1932-1942, Nov. 2015. 公式リンク
Nakamasa Inoue, Koichi Shinoda. Fast Coding of Feature Vectors using Neighbor-To-Neighbor Search, IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI), IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 38, no. 6, pp. 1170-1184, Sept. 2015. 公式リンク
Johan Rohdin, Sangeeta Biswas, Koichi Shinoda. Robust Discriminative Training Against Data Insufficiency in PLDA-Based Speaker Verification, Elsevier Computer Speech and Language, vol. 35, pp. 32-57, June 2015.
Sangeeta Biswas, Johan Rohdin, Koichi Shinoda. Autonomous Selection of i-Vectors for PLDA Modelling in Speaker Verification, Elsevier Speech Communication, Elsevier, vol. 72, pp. 32-46, May 2015. 公式リンク
Nakamasa Inoue, Koichi Shinoda. q-Gaussian Mixture Models for Image and Video Semantic Indexing, Journal of Visual Communication and Image Representation, vol. 24, no. 8, pp. 1450-1457, Nov. 2013.
Yusuke Kamishima, Nakamasa Inoue, Koichi Shinoda. Event detection in consumer videos using GMM supervectors and SVMs, EURASIP Journal on Image and Video Processing, vol. 2013:51, pp. 1-13, Sept. 2013. 公式リンク
Felipe Gomez-Caballero, Takahiro Shinozaki, Sadaoki Furui, Koichi Shinoda. A statistical approach for person verification using human behavioral patterns, EURASIP Journal on Image and Video Processing 2013, 2013:44, pp. 1-11, Aug. 2013.
Ryo Yokoyama, Yu Nasu, Koji Iwano, Koichi Shinoda. Detection of overlapped speech using lapel microphones in meeting, Speech Communication, vol. 55, pp. 941-949, June 2013.
Hilman F. Pardede, Koji Iwano, Koichi Shinoda. Feature normalization based on non-extensive statistics for speech recognition, Speech Communication, vol. 55, pp. 587-599, Mar. 2013.
Pardede, H., Iwano, K., Koichi Shinoda. Spectral subtraction based on non-extensive statistics for speech recognition, IEICE Transactions on Information and Systems, Vol. E96-D, No. 8, pp. 1774-1782, 2013.
Hiroko MURAKAMI, Koichi SHINODA, Sadaoki FURUI. Active Learning Using Phone-Error Distribution for Speech Modeling, IEICE TRANS. INF. & SYST, Vol. E95-D, No. 10, pp. 2486-2494, Oct. 2012.
Takafumi Koshinaka, Kentaro Nagatomo, Koichi Shinoda. Online speaker clustering using incremental learning of an ergodic hidden Markov model, IEICE TRANS. INF. & SYST, Vol. E95-D, No. 10, pp. 2469-2478, Oct. 2012.
Nakamasa Inoue, Koichi Shinoda. A Fast and Accurate Video Semantic-Indexing System Using Fast MAP Adaptation and GMM Supervectors, IEEE Transactions on Multimedia, vol. 14, Issue: 4 Part 2, pp. 1196-1205, Aug. 2012.
大西祥史, 江森正, 越仲孝文, 篠田浩一. 音声認識におけるモデル間スケーリング係数の自動推定, 電子情報通信学会論文誌, Vol. J95-D, No. 5, pp. 1276-1285, May 2012.
Muhammad Rasyid AQMAR, Koichi SHINODA, Sadaoki FURUI. Robust Gait-Based Person Identification against Walking Speed Variations, IEICE Trans. Inf. & Syst, Vol. E95-D, No. 2, pp. 668-676, Feb. 2012.
yuzo hamanaka, Koichi Shinoda, Takuya Tsutaoka, SADAOKI FURUI, Tadashi Emori, Takafumi KOSHINAKA. Committee-Based Active Learning for Speech Recognition, IEICE Trans. Inf. & Syst, vol. E94-D, No. 10, pp. 2015-2023, Oct. 2011.
Koichi Shinoda, Yasushi Watanabe, Kenji Iwata, Yuan Liang, Ryuta Nakagawa, Sadaoki Furui. Semi-synchronous speech and pen input for mobile user interfaces, Speech Communication, Elsevier, Vol. 53, pp. 283-291, Mar. 2011.
井上中順, 斉藤辰彦, 篠田浩一, 古井貞熙. 大規模映像資源のためのマルチモーダル高次特徴検出, 電子情報通信学会論文誌, 電子情報通信学会, Vol. J93-D, No. 12, pp. 2633-2644, Dec. 2010.
Koichi Shinoda. (Invited Paper) Acoustic Model Adaptation for Speech Recognition, IEICE Transactions on Information and Systems, vol. E93-D, no. 9, pp. 2348-2362, Sept. 2010.
望月貴裕, 藤井真人, 篠田浩一, 酒井善則. シンボル列化したシーンの学習と2種のプレイ種相関度による野球放送映像プレイ種識別, 電子情報通信学会論文誌, Vol. J93-D, No. 6, pp. 1009-1023, June 2010.
Nazrul Effendy, Koichi Shinoda, Sadaoki Furui, Somchai Jitapunkul. Automatic recognition of Indonesian declarative questions and statements using polynomial coefficients of the pitch contours, The Acoustical Society of Japan, Accoust. Sci. & Tech., The Acoustical Society of Japan, No. 30, pp. 249-256, Apr. 2009.
望月貴裕, 藤井真人, 八木伸行, 篠田浩一. 投球の次ショットに重きを置いたシーンのパターン化と離散隠れマルコフモデルを用いた野球放送映像の自動イベント分類, 映像情報メディア学会誌, Vol. 61, No. 8, pp. 1139-1149, Aug. 2007.
Agnieszka Betkowska, Koichi Shinoda, Sadaoki Furui. Robust Speech Recognition Using Factorial HMMs for Home Environments, EURASIP Journal on Advances in Signal Processing, Vol. 2007, No. 20593, May 2007.
Nguyen Huu Bach, Koichi Shinoda, Sadaoki Furui. Robust Scene Extraction Using Multi-Stream HMMs for Baseball Broadcast, IEICE Transactions on Information and Systems, Vol. E89-D, No. 9, pp. 2553-2561, Sept. 2006.
篠田浩一. 確率モデルによる音声認識のための話者適応化技術（サーベイ論文）, 電子情報通信学会論文誌, vol. J87-D, no. 2, pp. 371-386, Apr. 2004.
武田晴登, 篠田浩一, 嵯峨山茂樹. 確率モデルによる多声音楽演奏のMIDI信号のリズム認識, 情報処理学会論文誌, Vol. 45, No. 3, pp. 670-679, Mar. 2004.
K. Shinoda, C.-H. Lee. A structural Bayes approach to speaker adaptation, IEEE Trans. Speech Audio Processing, Vol. 9, No. 3, pp. 276-287, 2001.
江森正, 篠田浩一. 音声認識のための高速最ゆう推定を用いた声道長正規化, 電子情報通信学会論文誌, Vol. J83-D-II, No. 11, pp. 2108-2117, Nov. 2000.
K. Shinoda, T. Watanabe. MDL-based context-dependent subword modeling for speech recognition, Journal of Acoustic Society of Japan (E), Vol. 21, No. 2, pp. 79-86, 2000.
篠田浩一, 渡辺隆夫. 音声認識における自律的なモデル複雑度制御を用いた話者適応化, 電子情報通信学会和文論文誌D-II, Vol. J79-D-II, No. 12, pp. 2054-2061, Dec. 1996.
篠田浩一, 磯健一, 渡辺隆夫. 音声認識のためのスペクトル内挿を用いた話者適応化, 電子情報通信学会論文誌A, Vol. J77-A, No. 2, pp. 120-127, Feb. 1994.
K. Shinoda, T. Kii, K. Mitsuda, F. Nagase, Y. Tanaka. Discovery of the Quasi-Periodic Oscillations from X-Ray Pulsar X1627-673, Publ. Astron. Soc. Japan, Vol. 42, pp. 27-32, 1990.

著書

岩野公司, 河原達也, 篠田浩一, 伊藤彰則, 増村亮, 小川哲司, 駒谷和範. 音響学講座 7 音声(下), コロナ社, Jan. 2023.
篠田浩一. 「音声認識」(機械学習プロフェッショナルシリーズ), 株式会社講談社, Dec. 2017.
Agnieszka Betkowska Cavalcante, Koichi Shinoda, Sadaoki Furui. Robust speech recognition in the car environment, LTC 2009, LNAI 6562, Springer, pp. 24-34, July 2011.
元田浩, 栗田多喜夫, 樋口知之, 松本裕治, 村田昇, 赤穂昭太郎, 神嶌敏弘, 杉山将, 小野田崇, 池田和司, 鹿島久嗣, 賀沢秀人, 中島伸一, 竹内純一, 持橋大地, 小山聡, 井手剛, 篠田浩一, 山川宏. パターン認識と機械学習（下）ベイズ理論による統計的予測, パターン認識と機械学習・ベイズ理論による統計的予測, 丸善出版, page 433, July 2008.
元田浩, 栗田多喜夫, 樋口知之, 松本裕治, 村田昇, 赤穂昭太郎, 神嶌敏弘, 杉山将, 小野田崇, 池田和司, 鹿島久嗣, 賀沢秀人, 中島伸一, 竹内純一, 持橋大地, 小山聡, 井手剛, 山川宏, 篠田浩一. パターン認識と機械学習（上）：ベイズ理論による統計的予測, パターン認識と機械学習・ベイズ理論による統計的予測, シュプリンガー・ジャパン, Dec. 2007.
Takao Watanabe, Kaichiro Hatazaki, Ken-ichi Iso, Ryosuke Isotani, Koichi Shinoda, Keizaburo Takagi. Speech Recognition System in NEC, Spoken Language Systems, Ohmsha, pp. 34-46, Sept. 2005.
Koichi Shinoda. Speech Recognition System in NEC, Spoken Language Systems, 2005.

国際会議発表 (査読有り)

Wei Ming Neo, Koichi Shinoda, Tat-Jen Cham. Diffusion Pretraining for Gait Recognition in the Wild, The IEEE International Conference on Image Processing (ICIP) 2025, 2025 IEEE International Conference on Image Processing (ICIP), IEEE, pp. 1295 - 1300, Sept. 2025.
Roland Hartanto, Sakti Sakriani, Koichi Shinoda. SepVAC: Multitask Learning of Speaker Separation, Speaker Localization, Microphone Array Localization, and Room Acoustic Parameter Estimation in Various Acoustic Conditions, Interspeech 2025, Proc. Interspeech 2025, International Speech Communication Association (ISCA), pp. 2480-2484, Aug. 2025. 公式リンク
Takuya Asakura, Nakamasa Inoue, Koichi Shinoda. Diffusion-based Generative Regularization for Supervised Discriminative Learning, IEEE/CVF Winter Conference on Applications of Computer Vision (WACV) 2025, Proceedings of the Winter Conference on Applications of Computer Vision (WACV), IEEE, pp. 8915-8926, Mar. 2025. 公式リンク
Yuki Nishi, Koichi Shinoda, Koji Iwano. LDMSE: Low Computational Cost Generative Diffusion Model for Speech Enhancement, 2024 Asia Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC, 2024 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), IEEE, pp. 1-6, Jan. 2025.
Ruoyue Shen, Nakamasa Inoue, Koichi Shinoda. Pyramid Coder: Hierarchical Code Generator for Compositional Visual Question Answering, 2024 IEEE International Conference on Image Processing (ICIP 2024), 2024 IEEE International Conference on Image Processing (ICIP), IEEE, pp. 430-436, Sept. 2024. 公式リンク
Roland Hartanto, Sakriani Sakti, Koichi Shinoda. MSDET: Multitask Speaker Separation and Direction-of-Arrival Estimation Training, Interspeech 2024, Proc. Interspeech 2024, International Speech Communication Association (ISCA), pp. 2170-2174, Sept. 2024. 公式リンク
Nitish Jaiswal, Vi Duc Huan, Felix Limanta, Koichi Shinoda, Masahiro Wakasa. Domain-Specific Adaptation for Enhanced Gait Recognition in Practical Scenarios, International Conference on Image, Video and Signal Processing (IVSP) 2024, Proceedings of the 2024 6th International Conference on Image, Video and Signal Processing, Association for Computing Machinery, ACM, Page 8-15, Mar. 2024.
Shinichi Ka, Koichi Shinoda. Co-speech Gesture Generation with Variational Auto Encoder, Multimedia Modeling(MMM) 2024, Lecture Notes in Computer Science on MultiMedia Modeling (MMM 2024), Springer, Cham, vol. 14556, Jan. 2024. 公式リンク
Felix Limanta, Kuniaki Uto, Koichi Shinoda. CAMOT: Camera Angle-aware Multi-Object Tracking, IEEE/CVF Winter Conference on Applications of Computer Vision (WACV) 2024, 2024 IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), IEEE, pp. 6465-6474, Jan. 2024. 公式リンク
Lei Yang, Yuzhe Hao, Koichi Shinoda. Sensor Data Representation with Transformer-Based Contrastive Learning for Human Action Recognition and Detection, 31st European Signal Processing Conference, EUSIPCO 2023, 2023 31st European Signal Processing Conference (EUSIPCO), IEEE, pp. 1703-1707, Nov. 2023. 公式リンク
Kai Shigemi, Shuji Komeiji, Takumi Mitsuhashi, Yasushi Iimura, Hiroharu Suzuki, Hidenori Sugano, Koichi Shinoda, Kohei Yatabe, Toshihisa Tanaka. Synthesizing Speech from ECoG with a Combination of Transformer-Based Encoder and Neural Vocoder, 2023 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2023), ICASSP 2023 - 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), IEEE, June 2023. 公式リンク
Yuzhe Hao, Kuniaki Uto, Asako Kanezaki, Ikuro Sato, Rei Kawakami, Koichi Shinoda. EvIs-Kitchen: Egocentric Human Activities Recognition with Video and Inertial Sensor data, 29TH INTERNATIONAL CONFERENCE ON MULTIMEDIA MODELING (MMM), Proc. International Conference on MULTIMEDIA MODELING, Springer Nature, pp. 373–384, Mar. 2023.
Ruoyue Shen, Nakamasa Inoue, Koichi Shinoda. Text-Guided Object Detector for Multi-modal Video Question Answering, IEEE/CVF Winter Conference on Applications of Computer Vision (WACV) 2023, Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), 2023, IEEE, pp. 1032-1042, Jan. 2023. 公式リンク
Roland Hartanto, Kuniaki Uto, Koichi Shinoda. Lattice-Based Data Augmentation for Code-Switching Speech Recognition, Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC) 2022, Proceedings of 2022 APSIPA Annual Summit and Conference, IEEE, pp. 1667-1672, Nov. 2022.
Pablo Cervantes, Yusuke Sekikawa, Ikuro Sato, Koichi Shinoda. Implicit Neural Representations for Variable Length Human Motion Generation, European Conference on Computer Vision 2022, Proc. European Conference on Computer Vision (ECCV), Lecture Notes in Computer Science, Springer, Cham, Vol. 13677, pp. 356–372, Oct. 2022. 公式リンク
Takeru Ito, Kuniaki Uto, Koichi Shinoda. RI-DC: Rotation-Invariant Detection and Classification for Wheat Head Detection, IGARSS 2022 - 2022 IEEE International Geoscience and Remote Sensing Symposium, IGARSS 2022 - 2022 IEEE International Geoscience and Remote Sensing Symposium Proceedings, IEEE, pp. 5750-5753, July 2022. 公式リンク
Kengo Machida, Kuniaki Uto, Koichi Shinoda, Taiji Suzuki. MSR-DARTS: Minimum Stable Rank of Differentiable Architecture Search, International Joint Conference on Neural Networks (IJCNN) 2022, Proc. IJCNN2022, IEEE, July 2022. 公式リンク
Shuji Komeiji, Kai Shigemi, Takumi Mitsuhashi, Yasushi Iimura, Hiroharu Suzuki, Hidenori Sugano, Koichi Shinoda, Toshihisa Tanaka. Transformer-Based Estimation of Spoken Sentences Using Electrocorticography, 2022 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP2022, IEEE, May 2022. 公式リンク
Mariana Rodrigues Makiuchi, Kuniaki Uto, Koichi Shinoda. MULTIMODAL EMOTION RECOGNITION WITH HIGH-LEVEL SPEECH AND TEXT FEATURES, IEEE Automatic Speech Recognition and Understanding Workshop (ASRU) 2021, 2021 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU) Proceedings, IEEE, pp. 350-357, Dec. 2021.
Kohei Ozamoto, Kuniaki Uto, Koji Iwano, Koichi Shinoda. Noise-Tolerant Time-Domain Speech Separation with Noise Bases, 13th Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), 2021 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC) PROCEEDINGS, IEEE, pp. 624-629, Dec. 2021. 公式リンク
Keita Takayama, Ikuro Sato, Teppei Suzuki, Rei Kawakami, Kuniaki Uto, Koichi Shinoda. Smooth Transfer Learning for Source-to-Target Generalization, NeurIPS 2021 Workshop on Distribution Shifts: Connecting Methods and Applications, Proc. NeurIPS 2021 Workshop on Distribution Shifts: Connecting Methods and Applications, Dec. 2021. 公式リンク
Kong Aik Lee, Koji Okabe, Hitoshi Yamamoto, Qiongqiong Wang, Ling Guo, Takafumi Koshinaka, Jiacen Zhang, Keisuke Ishikawa, Koichi Shinoda. NEC-TT Speaker Verification System for SRE'19 CTS Challenge, Interspeech 2020, Proc. Interspeech 2020, Oct. 2020.
Kuniaki Uto, Mauro Dalla Mura, Yuka Sasaki, Koichi Shinoda. Estimation of leaf angle distribution based on statistical properties of leaf shading distribution, IGARSS2020, IGARSS 2020-2020 IEEE International Geoscience and Remote Sensing Symposium Proceedings, IEEE, pp. 5195-5198, Oct. 2020.
Kuniaki Uto, Mauro Dalla Mura, Jocelyn Chanussot, Koichi Shinoda. Estimation of Diffuse Component of Global Radiation Based on Leaf-Scale Crop Images, 2019 IEEE International Geoscience and Remote Sensing Symposium, Proc. IGARSS 2019, IEEE, pp. 6263-6266, Nov. 2019.
Mariana Rodrigues Makiuchi, Tifani Warnita, Kuniaki Uto, Koichi Shinoda. Multimodal Fusion of BERT-CNN and Gated CNN Representations for Depression Detection, 9th International Audio/Visual Emotion Challenge and Workshop (AVEC) 2019, Proceedings of the 9th International on Audio/Visual Emotion Challenge and Workshop, Association for Computing Machinery, Page 55-63, Oct. 2019. 公式リンク
Kong Aik Lee, Hitoshi Yamamoto, Koji Okabe, Qiongqiong Wang, Ling Guo, Takafumi Koshinaka, Jiacen Zhang, Koichi Shinoda. The NEC-TT 2018 Speaker Verification System, INTERSPEECH 2019, Proc.INTERSPEECH 2019, Sept. 2019.
Dongxiao Wang, Hirokazu Kameoka, Koichi Shinoda. A MODIFIED ALGORITHM FOR MULTIPLE INPUT SPECTROGRAM INVERSION, INTERSPEECH 2019, Proc. Interspeech 2019, ISCA, page 4569-4573, Sept. 2019.
Raden Mu’az Mun’im, Nakamasa Inoue, Koichi Shinoda. SEQUENCE-LEVEL KNOWLEDGE DISTILLATION FOR MODEL COMPRESSION OF ATTENTION-BASED SEQUENCE-TO-SEQUENCE SPEECH RECOGNITION, 2019 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP2019, IEEE, page 6151-6155, May 2019.
Nakamasa Inoue, Koichi Shinoda. Few-Shot Adaptation for Multimedia Semantic Indexing, 26th ACM international conference on Multimedia, Proceedings of the 26th ACM international conference on Multimedia, Association for Computing Machinery, pp. 1110-1118, Oct. 2018.
Thao Minh Le, Nakamasa Inoue, Koichi Shinoda. A Fine-to-Coarse Convolutional Neural Network for 3D Human Action Recognition, 29TH BRITISH MACHINE VISION CONFERENCE, Proc. British Machine Vision Conference (BMVC), British Machine Vision Association (BMVA), Sept. 2018. 公式リンク
Jiacen Zhang, Nakamasa Inoue, Koichi Shinoda. I-vector Transformation Using Conditional Generative Adversarial Networks for Short Utterance Speaker Verification, Interspeech 2018, Proc. Interspeech 2018, ISCA, pp. 3613-3617, Sept. 2018. 公式リンク
Koji Okabe, Takafumi Koshinaka, Koichi Shinoda. Attentive Statistics Pooling for Deep Speaker Embedding, Interspeech 2018, Proc. Interspeech 2018, ISCA, pp. 2252-2256, Sept. 2018. 公式リンク
Tifani Warnita, Nakamasa Inoue, Koichi Shinoda. Detecting Alzheimer's Disease Using Gated Convolutional Neural Network from Audio Data, Interspeech 2018, Proc. Interspeech 2018, ISCA, pp. 1706-1710, Sept. 2018. 公式リンク
Thao Le Minh, Nobuyuki Shimizu, Takashi Miyazaki, Koichi Shinoda. Deep Learning Based Multi-modal Addressee Recognition in Visual Scenes with Utterances, The Twenty-Seventh International Joint Conference on Artificial Intelligence (IJCAI-18), Proceedings of the Twenty-Seventh International Joint Conference on Artificial Intelligence (IJCAI-18), pp. 1546-1553, July 2018. 公式リンク
Haoyi Zhang, Conggui Liu, Nakamasa Inoue, Koichi Shinoda. Multi-Task Autoencoder for Noise-Robust Speech Recognition, ICASSP 2018, Proc. ICASSP, pp. 5599-5603, Apr. 2018.
Yuki Yasui, Nakamasa Inoue, Koji Iwano, Koichi Shinoda. Multimodal Speech Recognition Using Mouth Images from Depth Camera, APSIPA ASC 2017, Proc. APSIPA, pp. 1233-1236, Dec. 2017. 公式リンク
Conggui Liu, Nakamasa Inoue, Koichi Shinoda. A Unified Network for Multi-Speaker Speech Recognition with Multi-Channel Recordings, APSIPA ASC 2017, Proc. APSIPA, pp. 1304-1307, Dec. 2017. 公式リンク
Shinya Matsui, Nakamasa Inoue, Yuko Akagi, Goshu Nagino, Koichi Shinoda. User Adaptation of Convolutional Neural Network for Human Activity Recognition, European Signal Processing Conference (EUSIPCO), 2017 25th European Signal Processing Conference (EUSIPCO), pp. 753-757, Oct. 2017. 公式リンク
Mengxi Lin, Nakamasa Inoue, Koichi Shinoda. CTC Network with Statistical Language Modeling for Action Sequence Recognition in Videos, ACM International Multimedia Conference 2017, Proc. ACM Multimedia Thematic Workshop, pp. 393-401, Oct. 2017.
Yasuhiro Shibasaki, Kotaro Funakoshi, Koichi Shinoda. Boredom Recognition based on Users' Spontaneous Behaviors in Multiparty Human-Robot Interactions, MMM2017 (23rd International Conference on Multimedia Modeling), Proc. MultiMedia Modeling (MMM), Springer, pp. 677-689, Jan. 2017. 公式リンク
Hitoshi Yamamoto, Koichi Shinoda. The NEC-TT Speaker Recognition System for NIST SRE16, NIST SRE workshop, Proc. NIST SRE workshop, Dec. 2016.
Tommi Kerola, Nakamasa Inoue, Koichi Shinoda. Graph Regularized Implicit Pose for 3D Human Action Recognition, Asia Pacific Signal and Information Processing Association (APSIPA), Proc. APSIPA, pp. 155-159, Dec. 2016.
Nakamasa Inoue, Koichi Shinoda. Adaptation of Word Vectors using Tree Structure for Visual Semantics, ACM Multimedia, Proc. ACM Multimedia, pp. 277-281, Oct. 2016.
Taichi Asami, Ryo Masumura, Yushi Aono, Koichi Shinoda. Recurrent Out-of-Vocabulary Word Detection Using Distribution of Features, INTERSPEECH2016, Proc. Interspeech, ISCA, pp. 1320-1324, Sept. 2016. 公式リンク
Nakamasa Inoue, Koichi Shinoda. Vocabulary Expansion Using Word Vectors for Video Semantic Indexing, ACM Multimedia 15, Proc. ACM Multimedia, pp. 851-854, Oct. 2015.
Jan Spurny, Michal Dolezel, Ondrej Kanich, Martin Drahansky, Koichi Shinoda. New Materials for Spoofing Touch-based Fingerprint Scanners, 2015 International Conference on Computer Application Technologies, Proc. International Conference on Computer Application Technologies, pp. 207-211, Sept. 2015. 公式リンク
Fumito Nishi, Nakamasa Inoue, Koichi Shinoda. Speaker Diarization Using Multi-Modal i-vectors, The 30th International Technical Conference on Circuits/Systems, Computers and Communications (ITC-CSCC) 2015, Proc. International Technical Conference on Circuits/Systems Computers and Communications (ITC-CSCC), pp. 27-30, June 2015.
Ryan Price, Kenichi Iso, Koichi Shinoda. Speaker Adaptation of Deep Neural Networks Using a Hierarchy of Output Layers, SLT 2014 (2014 IEEE Spoken Language Technology Workshop), Proc. Spoken Language Technology (SLT) Workshop, pp. 153-158, Dec. 2014.
Yuan Liang, Koji Iwano, Koichi Shinoda. An Efficient Error Correction Interface for Speech Recognition on Mobile Touchscreen Devices, SLT 2014 (2014 IEEE Spoken Language Technology Workshop), Proc. Spoken Language Technology (SLT) Workshop, pp. 454-459, Dec. 2014.
Tommi Kerola, Nakamasa Inoue, Koichi Shinoda. Spectral Graph Skeletons for 3D Action Recognition, The 12th Asian Conference on Computer Vision (ACCV 2014), Proc. Asian Conference on Computer Vision (ACCV), Springer International Publishing AG, Cham, pp. 1-16, Nov. 2014. 公式リンク
Nakamasa Inoue, Koichi Shinoda. n-Gram Models for Video Semantic Indexing, ACM Multimedia, Proc. ACM Multimedia (MM), ACM, pp. 777-780, Nov. 2014. 公式リンク
Yuan Liang, Koji Iwano, Koichi Shinoda. Simple Gesture-based Error Correction Interface for Smartphone Speech Recognition, Interspeech 2014 (The 15th Annual Conference of the International Speech Communication Association), Proc. Interspeech, pp. 1194-1198, Sept. 2014.
Johan Rohdin, Sangeeta Biswas, Koichi Shinoda. Discriminative PLDA training with application-specific loss functions for speaker verification, Odyssey 2014: The Speaker and Language Recognition Workshop, Proc. Odyssey Workshop, ISCA, pp. 26-32, June 2014. 公式リンク
Florian Metze, Koichi Shinoda. Semantics for Large-Scale Multimedia: New Challenges for NLP, ACL2014, June 2014. 公式リンク
Sangeeta Biswas, Johan Rohdin, Koichi Shinoda. i-Vector Selection for Effective PLDA Modeling in Speaker Recognition, Odyssey 2014: The Speaker and Language Recognition Workshop, Proc. Odyssey Workshop, ISCA, pp. 100-105, June 2014. 公式リンク
Johan Rohdin, Sangeeta Biswas, Koichi Shinoda. Constrained Discriminative PLDA Training for Speaker Verification, 2014 IEEE International Conference on Acoustic Speech and Signal Processing (ICASSP), Proc. International Conference on Acoustic Speech and Signal Processing (ICASSP), pp. 1689-1693, May 2014. 公式リンク
Zhuolin Liang, Nakamasa Inoue, Koichi Shinoda. Event Detection by Velocity Pyramid, Multimedia Modeling (MMM) 2014, Proc. Multimedia Modeling (MMM), pp. 353-364, Jan. 2014.
Nakamasa Inoue, Koichi Shinoda. Neighbor-To-Neighbor Search for Fast Coding of Feature Vectors, 2013 IEEE International Conference on Computer Vision, 2013 IEEE International Conference on Computer Vision, pp. 1233-1240, Dec. 2013.
Felipe Gomez-Caballero, Takahiro Shinozaki, Sadaoki Furui, Koichi Shinoda. Statistical Person Verification Using Behavioral Patterns from Complex Human Motion, New Trends in Image Analysis and Processing ICIAP 2013, New Trends in Image Analysis and Processing ICIAP 2013, pp. 550-558, Sept. 2013.
Ryan Price, Sangeeta Biswas, Koichi Shinoda. Combining Deep Speaker Specific Representations with GMM-SVM for Speaker Verification, INTERSPEECH2013, INTERSPEECH2013, pp. 2788-2792, Aug. 2013. 公式リンク
Muhammad Rasyid Aqmar, Koichi Shinoda, Sadaoki Furui. Efficient model training for HMM-based person identification by gait, 2012 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, Proceedings of 2012 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, Dec. 2012.
Tsutaoka Takuya, Koichi Shinoda. Acoustic Model Training Using Committee-Based Active and Semi-Supervised Learning for Speech Recognition, APSIPA ASC 2012, APSIPA ASC 2012, Dec. 2012.
Nakamasa Inoue, Koichi Shinoda. q-Gaussian Mixture Models Based on Non-Extensive Statistics for Image And Video Semantic Indexing, ACCV2012, ACCV2012, Nov. 2012.
Yusuke Kamishima, Nakamasa Inoue, Koichi Shinoda, Shunsuke Sato. MULTIMEDIA EVENT DETECTION USING GMM SUPERVECTORS AND SVMS, ICIP 2012, ICIP 2012, pp. 3089-3092, Oct. 2012.
Koichi Shinoda. Speech Technology Plays a Key Role in Video Semantic Indexing, First International Workshop on Audio and Multimedia Methods for Large-Scale Video Analysis (AMVA) at ACM Multimedia 2012, First International Workshop on Audio and Multimedia Methods for Large-Scale Video Analysis (AMVA) at ACM Multimedia 2012, pp. 1-2, Oct. 2012.
Ryo Yokoyama, Yu Nasu, Koichi Shinoda, Koji Iwano. Overlapped Speech Detection in Meeting Using Cross-Channel Spectral Subtraction and Spectrum Similarity, InterSpeech2012, InterSpeech2012, Sept. 2012. 公式リンク
Hilman F. Pardede, Koichi Shinoda, Koji Iwano. Q-Gaussian based spectral subtraction for robust speech recognition, InterSpeech2012, InterSpeech2012, Sept. 2012.
Hilman F. Pardede, Koichi Shinoda. Non-extensive Statistics for Feature Normalization in Speech Recognition, International Workshop on Statistical Machine Learning for Speech Processing (IWSML) 2012, Proc. International Workshop on Statistical Machine Learning for Speech Processing (IWSML) 2012, Mar. 2012. 公式リンク
Hiroko Murakami, Koichi Shinoda, Sadaoki Furui. Designing text corpus using phone-error distribution for acoustic modeling, 2011 IEEE Automatic Speech Recognition and Understanding Workshop(ASRU), Proc. IEEE Automatic Speech Recognition and Understanding Workshop (ASRU) 2011, pp. 191-195, Dec. 2011.
Nakamasa Inoue, Koichi Shinoda. A Fast MAP Adaptation Technique for GMM-supervector-based Video Semantic Indexing Systems, ACM Multimedia'11, Proc. ACM Multimedia 2011, pp. 1357-1360, Nov. 2011.
Felipe Gomez-Caballero, Takahiro Shinozaki, Sadaoki Furui, Koichi Shinoda. Person Authentication using 3D Human Motion, ACM Multimedia'11, Proc. Joint ACM Workshop on Human Gesture and Behavior Understanding 2011 (J-HGBU '11), pp. 35-40, Nov. 2011.
Mayumi Beppu, Koichi Shinoda, Sadaoki Furui. Noise Robust Speech Recognition based on Spectral Reduction Measure, APSIPA ASC 2011 Xi'an, Proc. APSIPA ASC 2011, No. PM.PS2, Oct. 2011.
Marc Ferras, Koichi Shinoda, SADAOKI FURUI. Structual Joint Factor Analysis for Speaker Recognition, INTERSPEECH2011, Proc. INTERSPEECH2011, pp. 2373-2376, Aug. 2011.
Hilman Pardede, Koichi Shinoda. Generalized-Log Spectral Mean Normalization for Speech Recognition, INTERSPEECH2011, INTERSPEECH, pp. 1645-1648, Aug. 2011.
SANGEETA BISWAS, Marc Ferras, Koichi Shinoda, SADAOKI FURUI. Acoustic Forest for SMAP-based Speaker Verification, INTERSPEECH2011, Proc. INTERSPEECH2011, pp. 2377-2380, Aug. 2011.
Yu Nasu, Koichi Shinoda, Sadaoki Furui. Cross-channel spectral subtraction for meeting speech recognition, ICASSP2011, Proc. ICASSP2011, pp. 4812-4815, May 2011.
Marc Ferras, Koichi Shinoda, Sadaoki Furui. Structual MAP adaption in GMM-supervector based speaker recognition, ICASSP2011, Proc. ICASSP2011, pp. 5432-5435, May 2011.
Hitoshi Yamamoto, Ken Hanazawa, Kiyokazu Miki, Koichi Shinoda. Dynamic Language Model Adaptation Using Keyword Category Classification, Interspeech 2010, Proc. Interspeech 2010, pp. 2426-2429, Sept. 2010.
Muhammad Rasyid Aqmar, Koichi Shinoda, Sadaoki Furui. Robust Gait Recognition against Speed Variation, ICPR2010, Proc. ICPR2010, IEEE, pp. 2190-2193, Aug. 2010.
Nakamasa Inoue, Tatsuhiko Saito, Koichi Shinoda, Sadaoki Furui. High-Level Feature Extraction Using SIFT GMMs and Audio Models, ICPR2010, Proc. ICPR2010, IEEE, pp. 3220-3223, Aug. 2010.
Yuzo Hamanaka, Koichi Shinoda, Sadaoki Furui, Tadashi Emori, Takafumi Koshinaka. Speech Modeling Based on Committee-Based Active Learning, ICASP2010, Proc. ICASP2010, pp. 4350-4353, Mar. 2010.
Agnieszka Betkowska Cavalcante, Koichi Shinoda, Sadaoki Furui. Robust Speech Recognition In The Car Environment, the 4th Language and Technology Conference (LTC'09), the 4th Language and Technology Conference (LTC'09), Language and Technology Conference, LTC, pp. 39-43, Nov. 2009.
Hideki Yasui, Koichi Shinoda, Sadaoki Furui, Koji Iwano. Noise robust speech recognition using spectral subtraction and F0 information extracted by Hough transform, Asia-Pacific Signal and Information Processing Association 2009 Annual Summit and Conference, Proc. Asia-Pacific Signal and Information Processing Association 2009 Annual Summit and Conference (APSIPA-ASC '09), Asia-Pacific Signal and Information Processing Association, pp. 631-634, Oct. 2009.
Koichi Shinoda, Hiroko Murakami, Sadaoki Furui. Speaker Adaptation Based on Two-Step Active Learning, INTERSPEECH 2009 BRIGHTON, Proc. INTERSPEECH 2009, 2009 ISCA,, pp. 576-579, Sept. 2009.
Takafumi Koshinaka, Kentaro Nagatomo, Koichi Shinoda. Online speaker clustering using incremental learning of an ergodic hidden markov model, IEEE ICASSP 2009, Proc. ICASSP 2009, IEEE, pp. 4093-4096, Apr. 2009.
Hsin-Lung Hsieh, Jen-Tzung Chien, Koichi Shinoda, Sadaoki Furui. Independent component analysis for noisy speech recognition, ICASSP 2009, Proc. ICASSP 2009, IEEE, pp. 4369-4372, Apr. 2009.
Koji Yamasaki, Koichi Shinoda, Sadaoki Furui. Automatically Estimating Number of Scenes for Rushes Summarization, TRECVID BBC Rushes Summarization Workshop (TVS 2008) at ACM Multimedia, Proc. TRECVID BBC Rushes Summarization Workshop (TVS 2008) at ACM Multimedia, TRECVID BBC Rushes Summarization Workshop (TVS 2008) at ACM Multimedia, pp. 129-133, Oct. 2008.
Kenji Iwata, Koichi Shinoda, SADAOKI FURUI. Robust spoken term detection using combination of phone-based and word-based recognition, INTERSPEECH2008, Proc. INTERSPEECH2008, pp. 2195-2198, Sept. 2008.
Yasushi Watanabe, Koichi Shinoda, SADAOKI FURUI. Time-lag Adaptation for Semi-synchronous Speech and Pen Input, INTERSPEECH2008, Proc. INTERSPEECH2008, pp. 2675-2678, Sept. 2008.
Shutaro Tanji, Koichi Shinoda, SADAOKI FURUI, Antonio Ortega. Improvement of eigenvoice-based speaker adaptation by parameter space clustering, INTERSPEECH2008, Proc. INTERSPEECH2008, pp. 1229-1232, Sept. 2008.
Agnieszka Betkowska, Koichi Shinoda, Sadaoki Furui. Home-Environment Adaptation of Phoneme Factorial Hidden Markov Models, Poznan, Poland, Proc. EUSIPCO 2007, EUSIPCO, pp. 2380-2384, Sept. 2007.
Jen-Tzung Chien, Koichi Shinoda, SADAOKI FURUI. Predictive Minimum Bayes Risk Classification for Robust Speech Recognition, INTERSPEECH2007, Proc. INTERSPEECH2007, pp. 1062-1065, Aug. 2007.
Tadashi Emori, Yoshifumi Onishi, Koichi Shinoda. Automatic Estimation of Scaling Factors Among Probabilistic Models in Speech Recognition, INTERSPEECH2007, Proc. INTERSPEECH 2007, pp. 1453-1456, Aug. 2007.
Hiroki Yamazaki, Koji Iwano, Koichi Shinoda, SADAOKI FURUI, Haruo Yokota. Dynamic Language Model Adaptation Using Presentation Slides for Lecture Speech Recognition, INTERSPEECH 2007, Proc. INTERSPEECH 2007, pp. 2349-2352, Aug. 2007.
Ryoichi Ando, Koichi Shinoda, SADAOKI FURUI, Takahiro Mochizuki. A Robust Scene Recognition System for Baseball Broadcast Using Date-Driven Approach, CIVR2007, Amsterdam, The Netherlands, Proc. CIVR2007, ACM, pp. 186-193, July 2007.
Yasushi Watanabe, Kenji Iwata, Ryuta Nakagawa, Koichi Shinoda, SADAOKI FURUI. Semi-Synchronous Speech and Pen Input, ICASSP 2007, Proc. ICASSP 2007, pp. I-409-412, Apr. 2007.
Agnieszka Betkowska, Koichi Shinoda, Sadaoki Furui. Speech Recognition Using FHMMs Robust against Nonstationary Noise, ICASSP 2007, Proc. ICASSP 2007, IEEE, pp. I-1029-1032, Apr. 2007.
Ryoichi Ando, Koichi Shinoda, Sadaoki Furui, Takahiro Mochizuki. Robust scene Recognition Using Language Models for Scene Contexts, MIR2006, ACM Workshop2006, Proc. MIR2006, ACM Workshop2006, pp. 99-106, Oct. 2006.
Jen-Tzung Chien, Chin-Hsien Huang, Koichi Shinoda, Sadaoki Furui. Towards Optimal Bayes Decision for Speech Recognition, ICASSP2006, Proc. ICASSP2006, pp. SLP-L2.6, May 2006.
Koichi Shinoda, Sadaoki Furui, Nguen Huu Bach. Robust highlight extraction using multi-stream Hidden Markov Models for baseball video, International Conference on Image Processing 2005 (ICIP2005),, Proc. International Conference on Image Processing 2005 (ICIP 2005), pp. III-173-176, Sept. 2005.
Koichi Shinoda. Hidden Markov Model for Automatic Transcription of MIDI Signals, IEEE Workshop on Multimedia Signal Processing, Proc. IEEE Workshop on Multimedia Signal Processing, Dec. 2002.
K. Shinoda. Efficient Reduction of Gaussian Components Using MDL Criterion for HMM-based Speech Recognition, ICASSP2002, Proc. ICASSP2002, pp. I-869-872, 2002.
S. Sagayama, K. Shinoda, M. Nakai, H. Shimodaira. Analytic Methods for Acoustic Model Adapation: A Review, Isca ITR-Workshop2001, Proc. Isca ITR-Workshop2001, pp. 67-76, 2001.
T. Emori, K. Shinoda. Rapid Vocal Tract Length Normalization using Maximum Likelihood Estimation, EuroSpeech2001, Proc. EuroSpeech2001, pp. 1649-1652, 2001.
K. Shinoda, C.-H. Lee. Unsupervised adaptation using structural Bayes approach, ICASSP-98, Proc. ICASSP-98, pp. II 793-796, 1998.
K. Shinoda, T. Watanabe. Acoustic modeling based on the MDL criterion for speech recognition, EuroSpeech-97, Proc. EuroSpeech-97, No. 1, pp. 99-102, 1997.
K. Shinoda, C.-H. Lee. Structural MAP speaker adaptation using hierarchical priors, IEEE Workshop on Speech Recognition and Understanding, Proc. IEEE Workshop on Speech Recognition and Understanding, pp. 381-387, 1997.
K. Shinoda, T. Watanabe. Speaker adaptation with autonomous model complexity control by MDL principle, ICASSP-96, Proc. ICASSP-96, pp. 717-720, 1996.
K. Takagi, K. Shinoda, H. Hattori, T. Watanabe. Unsupervised and incremental speaker adaptation under adverse environmental conditions, ICSLP-96, Proc. ICSLP-96, pp. 2079-2082, 1996.
K. Shinoda, T. Watanabe. Speaker adaptation with autonomous control using tree structure, EuroSpeech-95, Proc. EuroSpeech-95, pp. 1143-1146, 1995.
T. Watanabe, K. Shinoda, K. Takagi, K. Iso. High speed speech recognition using tree-structured probability density function, ICASSP-95, Proc. ICASSP-95, pp. 556-559, 1995.
K. Shinoda, T. Watanabe. Unsupervised speaker adaptation for speech recognition using demi-syllable HMM, ICSLP-94, Proc. ICSLP-94, pp. 435-438, 1994.
T. Watanabe, K. Shinoda, K. Takagi, E. Yamada. Speech recognition using tree-structured probability density function, ICSLP-94, Proc. ICSLP-94, pp. 223-226, 1994.
K. Shinoda, K. Iso, T. Watanabe. Speaker Adaptation for Demi-Syllable-Based Continuous-Density HMM, ICASSP-91, Proc. ICASSP-91, pp. 857-860, 1991.
K. Shinoda, K. Iso, T. Watanabe. Speaker adaptation for demi-syllable based speech recognition using continuous HMM,, ICSLP-90, Proc. of ICSLP-90, pp. 261-264, 1990.

国際会議発表 (査読なし・不明)

Koichi Shinoda. Structural MAP for LR & HMMs, IEEE ASRU 2023, Dec. 2023. 公式リンク公式リンク
Koichi Shinoda. Deep Learning and High-Performance Computing, International Conference on Recent Progresses in Science, Engineering and Technology, Dec. 2022.
Ronaldo Prata Amorim, Nakamasa Inoue, Koichi Shinoda. Tokyo Tech at TRECVID 2022: Multi-Stage Framework for Video Action Detection, TRECVID 2022, TRECVID Workshop, TRECVID, Dec. 2022.
Ronaldo Prata Amorim, Nakamasa Inoue, Koichi Shinoda. Tokyo Tech at TRECVID 2020: Relation Modeling for Video Action Detection, TREC Video Retrieval Evaluation (TRECVID) 2020, TRECVID 2020 Notebook Papers, TRECVID, Dec. 2020. 公式リンク
Keisuke Ishikawa, Kuniaki Uto, Koji Iwano, Koichi Shinoda. Team Takoyaki submission for VoxCeleb Speaker Recognition Challenge 2020, The VoxSRC Workshop 2020, Proc.The VoxSRC Workshop 2020, Visual Geometry Group, Oct. 2020. 公式リンク
Koichi Shinoda. Co-design of ML and HPC for video understanding, 1st International Workshop on Deep Video Understanding (DVU 2020), Oct. 2020. 公式リンク
Koichi Shinoda. Fast and cost-effective deep learning algorithm platform for video processing in social infrastructure, 2020 International Workshop on AI-Driven Social Innovation (IWAIDSI 2020), Jan. 2020.
Koichi Shinoda. Fast and cost-effective deep learning algorithm platform for video processing in social infrastructure, JST AIP ネットワークラボ第４回JST-NSF-DATAIA 国際連携シンポジウム, Jan. 2020.
Kuniaki Uto, Mauro Dalla Mura, Jocelyn Chanussot, Koichi Shinoda. Estimation of skylight conditions based on leaf-scale wheat images, Images et data : méthodes d'analyse et modélisation pour l'agriculture numérique, Mar. 2019. 公式リンク
K. A. LEE, H. Yamamoto, K. Okabe, Q. Wang, L. Guo, T. Koshinaka, J. Zhang, K. Shinoda. The NEC-TT Speaker Verification System for SRE’18, NIST 2018 Speaker Recognition Evaluation, Proc.NIST 2018 Speaker Recognition Evaluation, Dec. 2018.
Nakamasa Inoue, Chihiro Shiraishi, Aleksandr Drozd, Koichi Shinoda, Shi-wook Lee, Alex Chichung Kot. VANT at TRECVID 2018, 2018 TRECVID Workshop, Proc. TRECVID workshop, Nov. 2018. 公式リンク
Nakamasa Inoue, Ryosuke Yamamoto, Na Rong, Satoshi Kanai, Junsuke Masada, Chihiro Shiraishi, Shi-wook Lee, Koichi Shinoda. TokyoTech-AIST at TRECVID 2017: Multimedia Event Detection Using Deep CNNs and Zero-Shot Classifiers, TRECVID 2017, Proc. TRECVID workshop, pp. 1-6, Nov. 2017.
Y. Yatsu, T. Yoshii, N. Kawai, J. Sakuma, N. Inoue, K. Shinoda, T. Shimokawabe. Development of a cloud detection system utilizing image recognition technology, V WORKSHOP ON ROBOTIC AUTONOMOUS OBSERVATORIES, Oct. 2017.
Koichi Shinoda. Video Information Retrieval, The 2017 IEEE SPS Summer School on Visual Image Search and Visual Analytics (VISVA2017), July 2017.
Nakamasa Inoue, Ryosuke Yamamoto, Na Rong, Koichi Shinoda. TokyoTech at TRECVID 2016, TRECVID workshop, Proc. TRECVID workshop, pp. 1-6, Nov. 2016. 公式リンク
Koichi Shinoda. Video Semantic Indexing and Localization, 5th Joint Meeting of the Acoustical Society of America and the Acoustical Society of Japan, 5th Joint Meeting of the Acoustical Society of America and the Acoustical Society of Japan, tthe Acoustical Society of America through AIP Publishing LLC, vol. 140, no. 4, p. 3009, Nov. 2016. 公式リンク
Koichi Shinoda. Deep Learning for Speech, Image, and Video, International Conference on Computer, Control, Informatics, and Its Applications (IC3INA), Oct. 2016. 公式リンク
Nishi, F., Inoue, N., Iwano, K., Koichi Shinoda. TokyoTech at MediaEval 2016 Multimodal Person Discovery in Broadcast TV task, CEUR Workshop Proceedings, Vol. 1739, 2016.
Nakamasa Inoue, Tran Hai Dang, Ryosuke Yamamoto, Koichi Shinoda. TokyoTech at TRECVID 2015, TRECVID workshop, Proc. TRECVID workshop, pp. 1-10, Nov. 2015. 公式リンク
Fumito Nishi, Nakamasa Inoue, Koichi Shinoda. Combining Audio Features and Visual i-vector at MediaEval 2015 Multimodal Person Discovery in Broadcast TV, MediaEval 2015, Proc. MediaEval Workshop, Sept. 2015. 公式リンク
Koichi Shinoda. Robust Video Information Retrieval using Speech Technologies, Korea University, June 2015.
Koichi Shinoda. Robust video information retrieval using speech technologies, University of Information Technology, VNU-HCM, University of Information Technology, VNU-HCM, Jan. 2015.
Koichi Shinoda. A New Speech Recognition Paradigm Based on Deep Learning, University of Science, VNU-HCM, University of Science, VNU-HCM, Jan. 2015.
Nakamasa Inoue, Zhuolin Liang, Mengxi Lin, Tran Hai Dang, Koichi Shinoda, Zhang Xuefeng, Kazuya Ueki. TokyoTech-Waseda at TRECVID 2014, TRECVID workshop, Proc. TRECVID workshop, pp. 1-13, Nov. 2014.
Koichi Shinoda. Robust Video Information Retrieval using Speech Technologies, Language Technologies Institute, Carnegie Mellon University, June 2014.
Koichi Shinoda. Video Semantic Indexing Using Speech Technologies, Dublin City University, Dublin City University, Jan. 2014.
Koichi Shinoda. Statistical Video Semantic Indexing, National Chiao Tung University (國立交通大学), National Chiao Tung University (國立交通大学), Oct. 2013.
Sangeeta Biswas, Johan Rohdin, Koichi Shinoda. Tokyo Tech Speaker Recognition, NIST SRE 2012, NIST SRE 2012, Dec. 2012.
Nakamasa Inoue, Yusuke Kamishima, Kotaro Mori, Koichi Shinoda. TokyoTechCanon at TRECVID 2012, TRECVID 2012, TRECVID 2012, Nov. 2012.
Winston Hsu, Kunio Kashino, Keiichiro Hoashi, Koichi Shinoda, Duy-Dinh Le, Masanori Sugimoto. Mobile or Cloud-based Photo/Video Analytics?, Greater Tokyo Area Multimedia/Vision Workshop, Aug. 2012.
Nakamasa Inoue, Yusuke Kamishima, Toshiya Wada, Koichi Shinoda, Shunsuke Sato. TokyoTech+Canon at TRECVID 2011, TRECVID Workshop 2011, Proc.TRECVID Workshop 2011, Dec. 2011.
Koichi Shinoda. Speaker Adaptation Techniques for Automatic Speech Recognition, APSIPA ASC 2011 Xi'an, Proc. APSIPA ASC 2011, Oct. 2011.
Koichi Shinoda. Multimodal Interface for Error Correction in Speech Recognition, 2011 Annual Workshop of CORE projects, Microsoft Research Asia IJARC CORE6 Project Summary Booklet, June 2011.
Inoue, N., Kamishima, Y., Koichi Shinoda, Sato, S.. Multimedia Event Detection using GS-SVMs and Audio-HMMs, 2011 TREC Video Retrieval Evaluation Notebook Papers, 2011.
Inoue, N., Koichi Shinoda. Semantic indexing using GMM supervectors and tree-structured GMMs, 2011 TREC Video Retrieval Evaluation Notebook Papers, 2011.
Nakamasa Inoue, Toshiya Wada, Yusuke Kamishima, Koichi Shinoda, Ilseo Kim, Byungki Byun, Chin-Hui Lee. TT+GT at TRECVID 2010 Workshop, Proc. TRECVID Workshop 2010, Nov. 2010.
Marc Ferras, Sangeeta Biswas, Koichi Shinoda, Sadaoki Furui. NIST SRE 2010:Tokyo Tech Speaker Recognition, NIST 2010 Speaker recognition evaluation workshop, Proc. NIST 2010 Speaker Recognition Evaluation Workshop, NIST, June 2010.
Inoue, N., Wada, T., Kamishima, Y., Koichi Shinoda, Kim, I., Byun, B., Lee, C.-H.. Semantic indexing using GMM supervectors with MFCCs and SIFT features, 2010 TREC Video Retrieval Evaluation Notebook Papers, 2010.
Nakamasa Inoue, Shanshan Hao, Tatsuhiko Saito, Koichi Shinoda, Ilseo Kim, Chin-Hui Lee. TITGT at TRECVID 2009 Workshop, TRECVID Workshop (TRECVID 2009), Proc. TRECVID Workshop (TRECVID 2009), Nov. 2009.
Koichi Shinoda. Multimedia Information Retrieval Using Statistical Approach, Microsoft Research Asia 2009 Annual Workshop of IJARC, Microsoft Research Asia 2009 Annual Workshop of IJARC, pp. 13, July 2009.
Shanshan Hao, Yusuke Yoshizawa, Koji Yamasaki, Koichi Shinoda, Sadaoki Furui. Tokyo Tech at TRECVID 2008, TRECVID Workshop (TRECVID 2008), Proc. TRECVID Workshop (TRECVID 2008), Nov. 2008.
Koichi Shinoda, Kazuki Ishihara, Sadaoki Furui, Takahiro Mochizuki. Automatic score Scene Detection for Baseball Video, Symposium on Large-Scale Knowledge Resources(LKR2008), Symposium on Large-Scale Knowledge Resources(LKR2008), pp. 226-240, Mar. 2008.
Koichi Shinoda. An Interface Using Semi-synchronous Speech and Pen Input, IJARC(Microsoft)-Tokyo Institute of Technology Joint Symposium on "The forefront of the Speech Recognition Research", Proc. IJARC(Microsoft)-Tokyo Institute of Technology Joint Symposium on "The forefront of the Speech Recognition Research, Dec. 2007.
Taichi Nakamura, Koichi Shinoda, Sadaoki Furui. TokyoTech's TRECVIC2007 Notebook, TRECVID 2007 Workshop, Proc. TRECVID 2007 Workshop, TRECVID, Nov. 2007.
Agnieszka Betkowska, Koichi Shinoda, Sadaoki Furui. Comparative Study on Robust Speech Recognition against Nonstationary Noise in the Home Environment, Symposium on Large-Scale Knowledge Resources(LKR2007), Proc. Symposium on Large-Scale Knowledge Resources(LKR2007), pp. 175-178, Mar. 2007.
Koichi Shinoda, Ryoichi Ando, Sadaoki Furui, Takahiro Mochizuki. Robust Scene Recognition Using Scene Context Information for Video Contents, International Symposium on Large-Scale Knowledge Resources(LKR2007), Proc. International Symposium on Large-Scale Knowledge Resources(LKR2007), pp. 107-112, Mar. 2007.
Takashi Kobayashi, Wataru Nakano, Haruo Yokota, Koichi Shinoda, Sadaoki Furui. Presentation Scene Retrieval Exploiting Features in Videos Including Pointing and Speech Information, Symposium on Large-Scale Knowledge Resources(LKR2007)., Proc. Symposium on Large-Scale Knowledge Resources(LKR2007)., pp. 95-100, Mar. 2007.
Koichi Shinoda. Multimedia Information Retrieval Using Pattern Recognition Techniques, IJARC 2nd Symposium, Proc. Microsfot Research Asia IJARC 2nd Symposium, Nov. 2006.
Taichi Nakamura, Yuichi Miyamura, Koichi Shinoda, Sadaoki Furui. Tokyo Tech's TRECVID2006 Notebook, TRECVID Workshops, Proc. TRECVID Workshops, Nov. 2006.
Agnieszka Betkowska, Koichi Shinoda, Sadaoki Furui. FHMM for Robust Speech Recognition in Home Environment, International Symposium on Large-Scale Knowledge Resources (LKR), Proc. International Symposium on Large-Scale Knowledge Resources (LKR), pp. 129-132, Mar. 2006.
Koichi Shinoda, Sadaoki Furui. Robust Scene Recognition for Baseball Broadcast, International Symposium on Large-Scale Knowledge Resources(LKR2006), Proc. International Symposium on Large-Scale Knowledge Resources (LKR), pp. 91-94, Mar. 2006.
Agnieszka Betkowska, Koichi Shinoda, Sadaoki Furui. Model optimization for noise discrimination in home environment, Symposium on Large-Scale Knowledge Resources (LKR2005), Proc. Symposium on Large-Scale Knowledge Resources (LKR2005), pp. 167-170, Mar. 2005.
Koichi Shinoda, Nguyen Huu Bach, Sadaoki Furui, Naoki Kawai. Scene recognition using Hidden Markov Models for video database, Symposium on Large-Scale Knowledge Resources(LKR2005), Proc. Symposium on Large-Scale Knowledge Resources(LKR2005), pp. 107-110, Mar. 2005.
Koichi Shinoda. Robust Acoustic Modeling for Speech Recognition, 電子情報通信学会音声研究会, Proc. International Workshop "Beyond HMM", Vol. SP2004-82, pp. 7-12, Dec. 2004.

国内会議発表 (査読なし・不明)

Isaac MORALES NOLASCO, Koichi SHINODA, Momoko KITAZAWA, Yuriko KAISE, Shunsuke TAKAGI, Genichi SUGIHARA, Taishiro KISHIMOTO. Detection of Depression Using Web-Interview Data by LLM Enhanced with Multimodal Features, 電子情報通信学会パターン認識・メディア理解研究会, IEICE technical report, The Institute of Electronics, Information and Communication Engineers, Vol. 125, no. 348, pp. 49-54, Jan. 2026. 公式リンク
二通大地, HartantoRoland, 篠田浩一. マルチチャンネルモデルを用いた知識蒸留による単一チャンネル音声分離手法, 日本音響学会第154回（2025年秋季）研究発表会, 日本音響学会第154回（2025年秋季）研究発表会講演論文集, 一般社団法人日本音響学会, pp. 329–330, Sept. 2025.
二通大地, Roland Hartanto, 篠田浩一. 単一チャンネル音声分離のためのマルチチャンネルモデルを用いた知識蒸留手法, 電子情報通信学会音声研究会（SP）音学シンポジウム2025, 電子情報通信学会技術研究報告, 一般社団法人電子情報通信学会, Vol. 125, no. 74, pp. 10-15, June 2025. 公式リンク
Roland Hartanto, Sakriani Sakti, Koichi Shinoda. Multitask Training of Multi-channel Speaker Separation and Room Acoustic Parameter Estimation, 日本音響学会第153回(2025年春季)研究発表会, 日本音響学会第153回(2025年春季)研究発表会講演論文集, Acoustical Society of Japan, pp. 233-234, Mar. 2025. 公式リンク
伊藤光一, 篠田浩一. 音韻レベルの話者情報を用いた音声認識における話者適応, 日本音響学会第153回(2025年春季)研究発表会, 日本音響学会第153回(2025年春季)研究発表会講演論文集, 一般社団法人日本音響学会, pp. 991-992, Mar. 2025. 公式リンク
Cheuk Hee Lam, Nathania Nah, Koichi Shinoda, Momoko Kitazawa, Yuriko Kaise, Shunsuke Takagi, Genichi Sugihara, Taishiro Kishimoto. Detection of Depression Using Web-Interview Data, パターン認識・メディア理解研究会 (PRMU), IEICE Technical Report, The Institute of Electronics, Information and Communication Engineers (IEICE), Japan, vol. 124, no. 23, pp. 36-40, May 2024. 公式リンク公式リンク
西悠希, 岩野公司, 篠田浩一. 音声強調のための拡散モデルにおける計算量の削減, 日本音響学会第151回(2024年春季)研究発表会, 日本音響学会第151回(2024年春季)研究発表会講演論文集, 一般社団法人日本音響学会, Mar. 2024. 公式リンク
Roland Hartanto, Sakriani Sakti, Koichi Shinoda. Multitask Learning of Speaker Separation and Direction-of-Arrival Estimation, 日本音響学会第151回(2024年春季)研究発表会, 日本音響学会第151回(2024年春季)研究発表会講演論文集, Acoustical Society of Japan, pp. 69-70, Mar. 2024. 公式リンク
西悠希, 岩野広司, 篠田浩一. 拡散モデルを用いた音声強調の計算量削減, 第25回音声言語および第10回自然言語処理シンポジウム, 電子情報通信学会技術研究報告, 一般社団法人電子情報通信学会, vol. 123, no. 292, pp. 1-6, Nov. 2023.
賈辰一, 篠田浩一. 変分自己符号化器を用いた発話時の動作生成の研究, パターン認識・メディア理解研究会（PRMU）, 信学技報, vol. 123, no. 266, PRMU2023-29, pp. 74-79, 2023年11月, Nov. 2023. 公式リンク公式リンク
Nathania Nah, Yuri Tsuchiya, Takafumi Koshinaka, Koichi Shinoda. A Multimodal Model for Personality Recognition through Speech, 日本音響学会第150回(2023年秋季)研究発表会, 日本音響学会講演論文集, Acoustical Society of Japan, vol. 150, pp. 1323-1324, Sept. 2023. 公式リンク
Pablo Cervantes, Yusuke Sekikawa, Ikuro Sato, Koichi Shinoda. Implicit neural representations for variable length human motion generation, 第22回情報科学技術フォーラム（FIT2023）, Sept. 2023. 公式リンク公式リンク
浅倉拓也, 井上中順, 横田理央, 篠田浩一. 受容野の自動最適化によるモードに適応的なTransformerの開発, 人工知能学会全国大会 (第37回), 人工知能学会全国大会 (第37回)論文集, 一般社団法人人工知能学会, June 2023. 公式リンク
江良真結子, 井上中順, 篠田浩一, 村田勝寛, 笹田真人, 庭野聖史, 谷津陽一, 河合誠之. 天体画像における深層学習を用いたラインノイズ除去手法, 日本天文学会2023年春季年会, 日本天文学会2023年春季年会講演予稿集, Mar. 2023.
村田勝寛, 高橋一郎, 細川稜平, 笹田真人, 庭野聖史, 谷津陽一, 河合誠之, 篠田浩一, 井上中順, 伊藤亮介, 下川辺隆史. 畳み込みニューラルネットワークを用いたMITSuME望遠鏡画像からの突発天体検知, 第13回光赤外線天文学大学間連携ワークショップ, Feb. 2023.
Nathania Nah, Takafumi Koshinaka, Koichi Shinoda. Personality Recognition on Dyadic Interactions with Representation Learning, 第9回音声・音響・信号処理ワークショップ（SPEASIP）, IEICE technical report, The Institute of Electronics, Information and Communication Engineers (IEICE), vol. 122, no. 389, pp. 241-246, Feb. 2023. 公式リンク
江良真結子, 井上中順, 篠田浩一, 村田勝寛, 笹田真人, 細川稜平, 庭野聖史, 谷津陽一, 河合誠之. 天体画像における深層学習を用いたラインノイズ除去手法, 第13回光赤外線天文学大学間連携ワークショップ, Feb. 2023.
篠田浩一. 深層学習と高性能計算機科学, 電子情報通信学会Webinarテクノロジートレンドシリーズ, 電子情報通信学会Webinarテクノロジートレンドシリーズ, 2022年10月, Oct. 2022.
伊藤尚泰, 村田勝寛, 細川稜平, 笹田真人, 庭野聖史, 谷津陽一, 河合誠之, 篠田浩一, 井上中順, 伊藤亮介, 下川辺隆史. MITSuME望遠鏡画像に対する深層学習を用いた突発天体検知システムの構築, 日本天文学会2022年秋季年会, 日本天文学会2022年秋季年会講演予稿集, 公益社団法人日本天文学会, Sept. 2022.
浅倉拓也, 宇都有昭, 篠田浩一. TransformerにおけるToken-Mixingの探索, 人工知能学会全国大会 (第36回), 人工知能学会全国大会 (第36回)論文集, 一般社団法人人工知能学会, June 2022. 公式リンク
篠田浩一. フェロー記念講演： Co-Designに基づく深層学習基盤, 電子情報通信学会パターン認識・メディア理解研究会（PRMU）, Mar. 2022.
江良真結子, 井上中順, 篠田浩一, 細川稜平, 村田勝寛, 庭野聖史, 谷津陽一, 河合誠之. ロバスト主成分分析に基づく劣化CCDカメラ画像のノイズ除去, 日本天文学会2022年春季年会, 日本天文学会2022年春季年会講演予稿集, Mar. 2022.
Roland HARTANTO, Kuniaki UTO, Koichi SHINODA. Incorporating Acoustic and Textual Information for Language Modeling in Code-switching Speech Recognition, The Institute of Electronics, Information and Communication Engineers Technical Committee Conference (IEICE SP) 2022-03, IEICE Technical Report, The Institute of Electronics, Information and Communication Engineers, vol. 121, no. 385, pp. 56-63, Mar. 2022. 公式リンク
篠田浩一. 巨大深層モデルの高速・省資源開発基盤とその応用, 情報処理学会連続セミナー2021 第9回「AIトレンド：大規模モデルと生成モデル」, Oct. 2021.
山下和也, 古田真理, 井上恵, 髙岡昂太, 篠田浩一, 本村陽一. 複数擬人化エージェントの推薦によるオンラインイベントでの実証実験と利用者の行動分析, 人工知能学会全国大会 (第35回), 人工知能学会全国大会 (第35回), June 2021. 公式リンク
中村歩, 宇都有昭, 篠田浩一. 敵対的学習とノイズ付加を用いた深層学習の頑健性の向上, 第27回画像センシングシンポジウム, 第27回画像センシングシンポジウム, 画像センシング技術研究会, June 2021. 公式リンク
町田兼梧, 宇都有昭, 篠田浩一, 鈴木大慈. 畳み込み行列の安定ランクを用いた深層学習モデル構造探索, 人工知能学会全国大会 (第35回), 人工知能学会全国大会 (第35回)論文集, 一般社団法人人工知能学会, June 2021. 公式リンク
櫻井凜太郎, 宇都有昭, 篠田浩一. 部位の領域分割画像を入力とした微分可能レンダラによる人体の三次元再構成, パターン認識・メディア理解研究会（PRMU）, 電子情報通信学会技術研究報告, 一般社団法人電子情報通信学会, vol. 121, no. 23, pp. 31-36, May 2021. 公式リンク
宇都有昭, 篠田浩一. 空撮画像による個葉スケール群落構造解析に向けて, 農業情報学会2021年度年次大会, 農業情報学会2021年度年次大会要旨集, pp. 25-26, May 2021.
尾座本耕平, 岩野公司, 宇都有昭, 篠田浩一. 雑音の基底信号を用いた耐雑音性の高い時間領域音声分離, 音声研究会 (SP) (2021-03-EA-US-SP-SIP-SLP), 電子情報通信学会技術研究報告, 一般社団法人電子情報通信学会, vol. 120, no. 399, pp. 63-67, Mar. 2021. 公式リンク
林恒太朗, 古明地秀治, 三橋匠, 飯村康司, 鈴木皓晴, 菅野秀宣, 篠田浩一, 田中聡久. 頭蓋内脳波からのエンコーダ・デコーダモデルによる想像音声推定, 音声研究会（SP）, 信学技報, 一般社団法人電子情報通信学会, pp. 164-169, Mar. 2021.
篠田浩一. マルチメディア認識の最新技術とビッグデータ解析, 東工大 InfoSyEnergy 研究/教育コンソーシアム第 2 回公開シンポジウム, Dec. 2020.
髙山啓太, 宇都有昭, 篠田浩一. ［ショートペーパー］変分自己符号化器との統合によるFew-Shot継続学習, パターン認識・メディア理解研究会 (PRMU), 信学技報, 電子情報通信学会, vol. 120, no. 300, pp. 58-62, Dec. 2020. 公式リンク
古明地秀治, 田中聡久, 篠田浩一. 音声認識精度推定に基づく音素セット縮小, 第35回信号処理シンポジウム, 第35回信号処理シンポジウム講演論文集, Nov. 2020. 公式リンク
Rodrigues Makiuchi Mariana, Warnita Tifani, Uto Kuniaki, Shinoda Koichi. Speech-linguistic Multimodal Representation for Depression Severity Assessment, 第130回SLP研究発表会, IPSJ SIG Technical Report, Information Processing Society of Japan, Vol. 2019-SLP-130, No. 8, pp. 1-4, Dec. 2019. 公式リンク
篠田浩一. 超大規模深層学習に向けて, 第4回 JST-NSF-DATAIA 国際連携シンポジウム AI研究の最前線～超スマート社会実現に向けて～, Dec. 2019.
篠田浩一. 映像処理のための高速かつ低コストな深層学習アルゴリズムの開発, 209-1 デジタル・イメージング技術部会, July 2019.
町田兼梧, 井上中順, 篠田浩一. KL統計量に基づくニューラルネットワークのプルーニング, 第22回画像の認識・理解シンポジウム, 第22回画像の認識・理解シンポジウム, July 2019.
篠田浩一. 深層学習と高性能計算, xSIG 2019, May 2019.
宇都有昭, ダラムラマウロ, シャヌソジョセリン, 篠田浩一. 個葉スケール作物画像からの特徴抽出に関する検討, 一般社団法人電子情報通信学会, 研究報告コンピュータビジョンとイメージメディア（CVIM）, Vol. 2019-CVIM-217, No. 38, pp. 106, May 2019.
Dongxiao WANG, Koichi SHINODA, Hirokazu KAMEOKA. A robust algorithm of phase recovery for speech enhancement, 電子情報通信学会音声研究会, IEICE Technical Report, 一般社団法人電子情報通信学会, pp. 137-142, Mar. 2019.
飯田康太, 谷津陽一, 伊藤亮介, 村田勝寛, 橘優太朗, 河合誠之, Yan Long, 篠田浩一, 井上中順, 下川辺隆史. 深層学習を用いた MITSuME 望遠鏡画像からの突発天体検知, 日本天文学会2019年春季年会, 日本天文学会2019年春季年会, Mar. 2019.
Dongxiao Wang, Hirokazu Kameoka, Koichi Shinoda. Improving the robustness of multiple input spectrogram inversion, 2019 Spring Meeting of the Acoustical Society of Japan, 2019年春季研究発表会講演論文集, Acoustical Society of Japan, 1307-1308, Mar. 2019. 公式リンク
篠田浩一. 情報理工学の現状と将来, 第40回蔵前科学技術セミナー, Feb. 2019. 公式リンク
飯田康太, 谷津陽一, 伊藤亮介, 村田勝寛, 橘優太朗, 河合誠之, Yan Long, 篠田浩一, 井上中順, 下川辺隆史. 深層学習を用いたMITSuME望遠鏡画像からの突発天体検知, 第9回光赤外線天文学大学間連携ワークショップ, 第9回光赤外線天文学大学間連携ワークショップ, Dec. 2018.
Thao Minh Le, Nakamasa Inoue, Koichi Shinoda. Skeleton-based Human Action Recognition with Fine-to-Coarse Convolutional Neural Network, Technical Committee on Pattern Recognition and Media Understanding (PRMU), IEICE Technical Report, The Institute of Electronics, Information and Communication Engineers, vol. 118, no. 362, pp. 61-64, Dec. 2018. 公式リンク
Jiacen Zhang, Nakamasa Inoue, Koichi Shinoda. Generative Adversarial Network Based i-Vector Transformation for Short Utterance Speaker Verification, 2018 Autumn Meeting of the Acoustical Society of Japan, ASJ 2018 Autumn Meeting, Acoustical Society of Japan, pp. 1345-1346, Aug. 2018. 公式リンク
Yan Long, Nakamasa Inoue, Koichi Shinoda, Yoichi Yatsu, Ryosuke Itoh, Nobuyuki Kawai. Astronomical Image Subtraction for Transient Detection Using CNN, The 21st Meeting on Image Recognition and Understanding (MIRU), 第21回画像の認識・理解シンポジウム論文講演集, 電子情報通信学会パターン認識・メディア理解(PRMU)研究専門委員会, Aug. 2018. 公式リンク
Tifani Warnita, Nakamasa Inoue, Koichi Shinoda. Alzheimer's Disease Prediction Using Audio Gated Convolutional Neural Network, 2018 Autumn Meeting of the Acoustical Society of Japan, ASJ 2018 Autumn Meeting, Acoustical Society of Japan, pp. 1223-1224, Aug. 2018. 公式リンク
金井怜, 井上中順, 李時旭, 篠田浩一. 単語分散表現を用いた動画からのイベント検出, 第21回画像の認識・理解シンポジウム (MIRU), 第21回画像の認識・理解シンポジウム論文講演集, 電子情報通信学会パターン認識・メディア理解(PRMU)研究専門委員会, Aug. 2018. 公式リンク
篠田浩一. 深層学習のためのCo-Design, SP/PRMU研究会, 電子情報通信学会技術研究報告 SP/PRMU, vol. 118, no. 112, pp. 65, June 2018.
篠田浩一. 社会インフラ映像処理のための高速・省資源深層学習アルゴリズム基盤, JST CREST「イノベーション創発に資する人工知能基盤技術の創出と統合化」研究領域成果展開シンポジウム「イノベーション創発を目指した研究開発」, Apr. 2018.
生田目敬弘, 亀岡弘和, 篠田浩一. 全層ゲート付き2次元畳み込みネットワークによる多重音信号の音高認識, 第120回音声言語情報処理研究会・第118回音楽情報科学研究会共催研究会, 研究報告音声言語情報処理（SLP）, 情報処理学会, vol. 120, no. 12, pp. 1-7, Feb. 2018. 公式リンク
篠田浩一. 高速かつ省資源な深層学習の実現に向けて, JST・NSF国際連携シンポジウム, Dec. 2017.
Mengxi Lin, Nakamasa Inoue, Koichi Shinoda. Action Sequence Recognition in Videos by Combining a CTC Network with a Statistical Language Model, Pattern Recognition and Media Understanding (PRMU) 2017-12, Technical Reports of IEICE PRMU, 電子情報通信学会, vol. 117, no. 362, pp. 1-6, Dec. 2017. 公式リンク公式リンク
篠田浩一. 深層学習の音声認識への応用, 情報処理学会連続セミナー2017 第4回ディープラーニングの活用と基盤, Oct. 2017. 公式リンク
安井勇樹, 岩野公司, 井上中順, 篠田浩一. 口唇深度画像を利用したディープオートエンコーダに基づくマルチモーダル音声認識, 日本音響学会, 日本音響学会2017年秋季研究発表会講演論文集, pp. 117-118, Sept. 2017.
Conggui Liu, Nakamasa Inoue, Koichi Shinoda. Joint training of speaker separation and speech recognit ion based on deep learning, ASJ 2017 Autumn Meeting, ASJ 2017 Autumn Meeting, pp. 63-64, Sept. 2017.
安井勇樹, 岩野公司, 井上中順, 篠田浩一. 口唇の深度画像を用いたディープオートエンコーダによるマルチモーダル音声認識, 音声研究会・音声言語情報処理研究会併催研究会, 情報処理学会研究報告 SLP, 情報処理学会, July 2017.
谷津陽一, 白石一輝, 吉井健敏, 河合誠之, 佐久間淳一, 井上中順, 篠田浩一, 下川辺隆史. Deep Learningを応用した全天画像からの気象識別, 天文学におけるデータ科学的方法, May 2017.
佐久間惇一, 篠田浩一, 井上中順, 谷津陽一, 吉井健敏, 河合誠之, 下川辺隆史. 畳み込みニューラルネットワークを用いた夜間全天画像からの雲領域検出, 情報処理学会第79回全国大会, 情報処理学会第79回全国大会論文集, pp. 283-284, Mar. 2017.
西史人, 井上中順, 岩野公司, 篠田浩一. 話者認識と顔画像認識を用いた映像におけるマルチモーダル人物同定, 日本音響学会2017年春季研究発表会, 日本音響学会2017年春季研究発表会講演論文集, 日本音響学会, pp. 129-130, Mar. 2017.
Conggui Liu, Nakamasa Inoue, Koichi Shinoda. Speaker Separation in Multi-Channel Environment Using Deep Learning, The 115th National Convention of IPSJ, Technical Reports of IPSJ SLP, Information Processing Society of Japan, vol. 115, no. 11, pp. 1-6, Feb. 2017. 公式リンク
篠田浩一. 東工大TSUBAMEの活用事例：マルチメディア認識のための深層学習, GTC Japan 2016, Oct. 2016. 公式リンク
谷津陽一, 吉井健敏, 針田聖平, 村木雄太郎, 河合誠之, 佐久間惇一, HyunJin Jung, 井上中順, 篠田浩一, 下川辺隆史, 太田佳. 突発天体観測用天文台全球リレーのための気象モニターの開発, 天文学会, 天文学会予稿集, p. 210, Sept. 2016.
岩野公司, 荒毛祐紀, 小平優希, 篠田浩一. 複数スマートフォンで収録された会話音声の対話グループ検出と話者決定の性能改善, 2016年8月度音声研究会, 電子情報通信学会技術研究報告 SP, 一般社団法人電子情報通信学会, vol. 116, no. 189, pp. 53-58, Aug. 2016.
Tran Hai Dang, Nakamasa Inoue, Koichi Shinoda. Concept Elimination for Zero-Shot Event Detection, The 22nd Symposium on Sensing via Image Information (SSII), 第22回画像センシングシンポジウム (SSII) 講演論文集, IS2-19, June 2016.
生田目敬弘, 亀岡弘和, 篠田浩一. 楽器と音高の同時認識のためのRNN音響モデル, 2016年度第111回音楽情報科学研究会音学シンポジウム2016, 第111回音楽情報科学研究会音学シンポジウム, 情報処理学会, vol. 111, no. 46, pp. 1-5, May 2016. 公式リンク
篠田浩一, 井上中順. (チュートリアル) 音声・画像・映像処理における深層学習, 言語処理学会第22回年次大会(NLP2016), 言語処理学会第22回年次大会(NLP2016) 講演論文集, 一般社団法人言語処理学会, Mar. 2016. 公式リンク
芝崎泰弘, 船越孝太郎, 篠田浩一. 多人数環境下でのロボットとの対話における人間の退屈状態の推定, パターン認識・メディア理解(PRMU)研究会, 電子情報通信学会技術研究報告 PRMU, vol. 115, no. 517, pp. 119-124, Mar. 2016.
小平優希, 篠田浩一, 岩野公司. 複数スマートフォンで収録された会話音声の相互スペクトル減算を用いた話者決定, 情報処理学会第78回全国大会, 情報処理学会第78回全国大会講演論文集, pp. 533-534, Mar. 2016.
井上中順, 篠田浩一. 単語ベクトルによる語彙拡張を用いた映像のセマンティックインデクシング, パターン認識・メディア理解(PRMU)研究会, 電子情報通信学会技術研究報告 PRMU, vol. 115, no. 388, pp. 75-80, Dec. 2015.
篠田浩一. 音声・画像・映像におけるDeep Learningを用いたパターン認識, 第43回 AIチャレンジ研究会 (SIG-Challenge), 人工知能学会AIチャレンジ研究会予稿集, 一般社団法人人工知能学会, pp. 1-6, Nov. 2015. 公式リンク
西史人, 井上中順, 篠田浩一. 音声・動画像の因子分析を用いる話者ダイアライゼーション, 2015年度日本音響学会秋季研究発表会, 日本音響学会2015年秋季研究発表会講演論文集, pp. 175-176, Sept. 2015.
Devin Hoesen, Ryan Price, Puji Lestari Dessi, Koichi Shinoda. A DNN-Based ASR System for the Indonesian Language, ASJ (Acoustical Society of Japan) 2015 Autumn Meeting, Proc. ASJ 2015 Autumn Meeting, pp. 5-6, Sept. 2015.
松山祐輔, Ryan Price, 篠田浩一. 活性化関数のパラメータ制御を用いた LSTM による音声認識, 平成２７年度日本音響学会秋季研究発表会, 日本音響学会2015年秋季研究発表会講演論文集, pp. 1-2, Sept. 2015.
篠田浩一. 音声認識のためのDeep Learning 企画シンポジウムディープラーニングの切り口：神経回路学会の視点から, 第25回日本神経回路学会全国大会, Sept. 2015.
芝崎泰弘, 船越孝太郎, 篠田浩一. ロボットとの対話における人間の「退屈」状態の解析, 2015年度第14回情報科学技術フォーラム（FIT2015）, 第14回情報科学技術フォーラム講演論文集 (FIT), 一般社団法人情報処理学会, vol. 14, no. 3, pp. 163-166, Aug. 2015. 公式リンク
西史人, 井上中順, 篠田浩一. マルチモーダルi-vectorを用いた話者ダイアライゼーション, 平成27年度第107回情報処理学会音声言語情報処理研究会, 情報処理学会研究報告 SLP, vol. 107, no. 4, pp. 1-6, July 2015.
福田竣, 井上中順, 篠田浩一. CNNから抽出した複数特徴量の統合に基づいた映像の意味インデクシング, 第21回画像センシングシンポジウム (SSII), 第21回画像センシングシンポジウム (SSII) 講演論文集, IS2-16, June 2015.
篠田浩一. 統計的パターン認識のための中間表現, 2015年3月度音声研究会, 電子情報通信学会技術研究報告 SP, vol. 114, no. 474, pp. 73, Mar. 2015.
Tommi Kerola, Nakamasa Inoue, Koichi Shinoda. Spectral Graph Wavelets for Skeleton-based 3D Action Recognition, Technical Reports of IEICE PRMU, Technical Reports of IEICE PRMU, The Institute of Electronics, Information and Communication Engineers (IEICE), vol. 114, no. 454, pp. 131-136, Feb. 2015. 公式リンク
浅見太一, 岩野公司, 小川哲司, 駒谷和範, 齋藤大輔, 篠田浩一, 太刀岡勇気, 東中竜一郎, 福田隆, 増村亮, 渡部晋治. 国際会議INTERSPEECH2014，SLT2014参加報告, 研究報告音声言語情報処理（SLP）, 一般社団法人情報処理学会, Vol. 2015, No. 7, pp. 1-6, Feb. 2015.
Mengxi Lin, Nakamasa Inoue, Koichi Shinoda. Human Action Retrieval Based on Temporal Matching, Technical Reports of IEICE PRMU, Technical Reports of IEICE PRMU, IEICE Technical Committee, vol. 114, no. 454, pp. 125-130, Feb. 2015. 公式リンク
Yuan Liang, Koji Iwano, Koichi Shinoda. Error Correction Using Long Context Match for Smartphone Speech Recognition, IPSJ-SLP, Technical Reports of IPSJ SLP, Information Processing Society of Japan, vol. 104, no. 22, pp. 1-6, Dec. 2014. 公式リンク
Yuan Liang, Koji Iwano, Koichi Shinoda. An Efficient Error Correction Method for Smartphone Speech Recognition, Proc. ASJ 2014 Autumn Meeting, 日本音響学会講演論文集2014年9月, 日本音響学会, pp. 29-30, Sept. 2014.
篠田浩一. Deep Learningによる新しい音声認識パラダイム, 日本神経回路学会主催セミナー「Deep Learningが拓く世界」, Aug. 2014.
押尾翔平, 岩野公司, 篠田浩一. 口唇の深度画像を用いたマルチモーダル音声認識, 2014年7月音声研究会・音声言語情報処理研究会合同研究会, 情報処理学会研究報告 SLP, 情報処理学会, vol. 102, no. 2, pp. 1-6, July 2014. 公式リンク公式リンク公式リンク
井上中順, 篠田浩一. Neighbor-To-Neighbor Search for Fast Coding of Feature Vectors, 第17回画像の認識・理解シンポジウム (MIRU), July 2014. 公式リンク
篠田浩一. 映像意味検索の未来, 第17回画像の認識・理解シンポジウム (MIRU), July 2014. 公式リンク
篠田浩一. 映像意味検索技術の最新動向, NEC Laboratories, July 2014.
篠田浩一. 映像検索への音声工学からのアプローチ, 音学シンポジウム2014, May 2014. 公式リンク
Nataliia Biriukova, Kotaro Funakoshi, Koichi Shinoda. Collection and analysis of multi-party interaction data for automatic boredom recognition, The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014, Proc. The 28th Annual Conference of the Japanese Society for Artificial Intelligence (JSAI) 2014, pp. 1-4, May 2014. 公式リンク
森宏太郎, 井上中順, 篠田浩一. Deep Learningを用いた映像のセマンティックインデクシングのための特徴次元削減, 2014年電子情報通信学会総合大会, 2014年電子情報通信学会総合大会講演論文集, pp. 85, Mar. 2014.
Zhuolin Liang, Nakamasa Inoue, Koichi Shinoda. Velocity Pyramid for Event Detection, Pattern Recognition and Media Understanding (PRMU), Technical Reports of IEICE PRMU, vol. 113, no. 493, pp. 13-18, Mar. 2014.
井上中順, 篠田浩一. 高速な画像分類のためのNeighbor-to-Neighbor探索, パターン認識・メディア理解研究会（PRMU）, 電子情報通信学会技術研究報告 PRMU, vol. 113, no. 493, pp. 97-102, Mar. 2014.
井上中順, 森宏太郎, Liang Zhuolin, 篠田浩一. TRECVID 映像意味インデクシングのための音声・音響技術, 日本音響学会2014年春季研究発表会, 日本音響学会2014年春季研究発表会講演論文集, pp. 129-130, Mar. 2014.
Sangeeta Biswas, Johan Rohdin, Koichi Shinoda. Training Multiple PLDA Models by Clustered I-Vectors for Speaker Verification, ASJ 2014 Spring Meeting, Proc. ASJ 2014 Spring Meeting, pp. 97-98, Mar. 2014.
Johan Rohdin, Sangeeta Biswas, Koichi Shinoda. Robust 0-1 Loss Training for PLDA in Speaker Verification, ASJ 2014 Spring Meeting, Proc. ASJ 2014 Spring Meeting, pp. 101-102, Mar. 2014.
Johan Rohdin, Sangeeta Biswas, Koichi Shinoda. Discriminatively Trained PLDA with Partially Preserved Model Assumptions in Speaker Verification, ASJ 2014 Spring Meeting, Proc. ASJ 2014 Spring Meeting, pp. 99-100, Mar. 2014.
篠田浩一. 映像意味検索技術の最新動向, 日本音響学会2014年春季研究発表会, 日本音響学会2014年春季研究発表会講演論文集, pp. 531-532, Mar. 2014.
篠田浩一. 映像意味検索の現状と課題, マルチメディア情報ハイディング・エンリッチメント研究会 (EMM), 電子情報通信学会技術研究報告 EMM, vol. 113, no. 480, pp. 1-2, Feb. 2014.
河原達也, 篠田浩一, 堀貴明, 堀智織, 篠崎隆宏. 「音声認識」は今後こうなる！, SIG-SLP第100回記念シンポジウム, page 6, Jan. 2014.
Koichi Shinoda. TRECVideo Semantic Indexing, Yahoo! Japan Research, Yahoo! Japan Research, Nov. 2013.
Qiongqiong Wang, Koichi Shinoda. A Regression Approach to Emotion Estimation in Spontaneous Speech, 2013 Autumn Meeting ASJ, 日本音響学会2013年秋季研究発表会講演論文集, pp. 87-88, Sept. 2013.
Ryan Price, Koichi Shinoda, Sangeeta Biswas. Fusing deep speaker specific features and MFCC for robust speaker verification, SLP2013, IPSJ SIG technical reports, Vol. 2013-SLP-97, No. 3, pp. 1-7, July 2013.
石川真也, 船越孝太郎, 篠田浩一, 中野幹生. 多人数対話ロボットの実現にむけたマルチモーダル対話データの収集と分析, 2013年度第27回日本人工知能学会全国大会, 2013年度人工知能学会全国大会(JSAI)論文集, 人工知能学会, pp. 224-227, June 2013.
安中哲也, 篠田浩一. 大語彙手話認識のための動素決定木クラスタリング, 第19回画像センシングシンポジウム, 第19回画像センシングシンポジウム, pp. IS3-18-1 to IS3-18-8, June 2013.
小塚俊来, 岩野公司, 篠田浩一. 発声様態依存モデルを用いた話者認識, 日本音響学会 2013年春季研究発表会, 日本音響学会講演論文集, pp. 185-188, Mar. 2013.
周澤西, 岩野公司, 篠田浩一. 音声認識のためのq ガウス分布を用いた音響モデル, 日本音響学会 2013年春季研究発表会, 日本音響学会講演論文集, pp. 175-178, Mar. 2013.
Ryan Price, Koichi Shinoda. Speaker verication using deep speaker-discriminative representations, 日本音響学会 2013年春季研究発表会, 2013 Spring Meeting ASJ, pp. 81-82, Mar. 2013.
網野加苗, 石原俊一, 小川哲司, 長内隆, 黒岩眞吾, 越仲孝文, 篠田浩一, 柘植覚, 西田昌史, 松井知子, 王龍標. 話者認識技術の現状と課題, SP, 電子情報通信学会技術研究報告, Vol. 112, No. 450, pp. 63-70, Feb. 2013.
上嶋勇祐, 井上中順, 篠田浩一. カメラの動き補正に基づく時空間特徴量とGMM supervectorを用いた映像からのイベント検出, PRMU, 電子情報通信学会技術研究報告, vol. 112, no. 441, pp. 185-190, Feb. 2013.
井上中順, 篠田浩一. GMM Supervectorとビデオクリップスコアを用いた映像のセマンティックインデクシング, PRMU, 電子情報通信学会技術研究報告, vol. 112, no. 441, pp. 173-178, Feb. 2013.
篠田浩一. コミュニケーションとしての映像とその検索, 第15回情報理論的学習理論ワークショップ(IBIS2012), 第15回情報理論的学習理論ワークショップ(IBIS2012), Nov. 2012.
篠田浩一. 映像検索技術の最新動向, 産業計測第36委員会研究会, Oct. 2012.
西野大輔, 篠田浩一, 古井貞熙. ディープラーニングを用いた日本語大語彙話し言葉音声認識, 日本音響学会2012年秋季研究発表会, 日本音響学会2012年秋季研究発表会講演論文集, Sept. 2012.
井上中順, 篠田浩一. 映像のセマンティックインデクシングのためのq-混合ガウス分布, 電子情報通信学会研究会発表, 信学技報, Vol. 112, No. 197, pp. 31-36, Sept. 2012.
井上中順, 篠田浩一. 映像のセマンティックインデクシングのためのq‐混合ガウス分布, 研究報告コンピュータビジョンとイメージメディア（CVIM）, 一般社団法人情報処理学会, Vol. 2012, No. 5, pp. 1-6, Aug. 2012.
Ta Minh THANH, Koichi SHINODA. A video watermarking method to objects robust against various attacks, Enriched Multimedia, IEICE Technical Report, 電子情報通信学会, Vol. 112, No. 190, pp. 43-48, Aug. 2012. 公式リンク
Nakamasa Inoue, Koichi Shinoda. Video Semantic Indexing Using GMM-Supervectors, Greater Tokyo Area Multimedia/Vision Workshop, Greater Tokyo Area Multimedia/Vision Workshop, Aug. 2012. 公式リンク
横山諒, 那須悠, 岩野公司, 篠田浩一. 複数ピンマイクで収音された会議音声の重畳区間検出, 音声言語情報処理研究会 SIG-SLP 2012, 情報処理学会研究報告, Vol. 2012-SLP-92, No. 6, July 2012.
秋葉友良, 岩野公司, 緒方淳, 小川哲司, 小野順貴, 篠崎隆宏, 篠田浩一, 南條浩輝, 西崎博光, 西田昌史, 西村竜一, 原直, 堀貴明. クラウド時代の新しい音声研究パラダイム, 情報処理学会研究報告, 情報処理学会研究報告, Vol. 2012-SLP-92, No. 4, July 2012.
篠田浩一. 映像検索技術の最前線, 第18回画像センシングシンポジウム, 第18回画像センシングシンポジウム講演論文集, OS3-02-1-4, June 2012.
井上中順, 篠田浩一. GMM-Supervectorを用いた映像の高速セマンティック検索システム, 第18回画像センシングシンポジウム, 第18回画像センシングシンポジウム講演論文集, DS2-08, June 2012.
Koichi Shinoda. Multimodal Interface for Error Correction in Speech Recognition, Japan CORE Project Workshop 2012, Microsoft Research Asia IJARC CORE7 Project Summary Booklet, pp. 15-16, June 2012. 公式リンク
Johan Rohdin, Koichi Shinoda. Speaker Adaptation for Dialog Act Recognition, 2012年春季研究発表会/2012 Spring Meeting, 2012 Spring Meeting ASJ, p. 111, Mar. 2012.
Yonatan Andy Fajar Nugraha, Koichi Shinoda, Sadaoki Furui, Koji Iwano. Recognition of Indonesian Code-Switching Speech, 2012年春季研究発表会/2012 Spring Meeting, 2012 Spring Meeting ASJ, pp. 75-76, Mar. 2012. 公式リンク
Hilman F. Pardede, Koichi Shinoda, Koji Iwano. A Compensation Technique Using q-Logarithm for Noisy Speech Recognition, 2012年春季研究発表会/2012 Spring Meeting, 2012 Spring Meeting ASJ, pp. 19-20, Mar. 2012. 公式リンク
Hilman F. Pardede, Koichi Shinoda, Koji Iwano. Spectral Subtraction Based on q-Gaussian Assumption for Noise Robust Speech Recognition, 2012年春季研究発表会/2012 Spring Meeting, 2012 Spring Meeting ASJ, pp. 21-22, Mar. 2012. 公式リンク
Sangeeta Biswas, Johan Rohdin, Koichi Shinoda, Sadaoki Furui. MAP Adaptation Using Multiple Priors for Speaker Verication, 2012年春季研究発表会/2012 Spring Meeting, 2012 Spring Meeting ASJ, pp. 79-82, Mar. 2012.
Yuan Liang, Koichi Shinoda, Sadaoki Furui. Language Model for Efficient Error Correction in Speech Recognition, 2012年春季研究発表会/2012 Spring Meeting, 2012 Spring Meeting ASJ, pp. 89-90, Mar. 2012.
蔦岡拓也, 篠田浩一. コミッティに基づく能動学習・半教師付き学習を用いた音声モデル, 2012年春季研究発表会/2012 Spring Meeting, 日本音響学会2012年春季研究発表会講演論文集, pp. 55-56, Mar. 2012.
横山諒, 那須悠, 篠田浩一, 岩野公司. 相互スペクトル減算と振幅スペクトル相関を用いた会議音声の重畳区間検出, 2012年春季研究発表会/2012 Spring Meeting, 日本音響学会2012年春季研究発表会講演論文集, pp. 13-14, Mar. 2012. 公式リンク
Muhammad Rasyid Aqmar, Koichi Shinoda, Sadaoki Furui. Subject adaptation and adaptive training for gait-based person identification, IEICE Pattern Recognition and Media Understanding Technical Committee Meeting, IEICE Technical Report, No. PRMU2011-199, pp. 77-82, Feb. 2012.
佐藤新, 篠田浩一. 手話素単位を用いた大語彙手話認識, 電子情報通信学会パターン認識・メディア理解研究会 (PRMU), 音声研究会 (SP),, 電子情報通信学会技術研究報告, No. PRMU2011-222, pp. 155-160, Feb. 2012.
上嶋勇祐, 井上中順, 篠田浩一, 佐藤俊介. GMM-SupervectorとSVMを用いた映像からのイベント検出, 電子情報通信学会技術研究報告（SP/PRMU), 電子情報通信学会技術研究報告, No. PRMU2011-230, pp. 195-200, Feb. 2012.
Yonatan Andy Fajar Nugraha, Koichi Shinoda, Sadaoki Furui. Two-pass approach for recognizing code-switching speech, IEICE Speech Technical Committee Meeting, IEICE Technical Report, No. SP2011-150, pp. 225-229, Feb. 2012.
和田俊也, 篠田浩一. 固定監視カメラからの人混み中の行動イベント検出, 電子情報通信学会技術研究報告（SP/PRMU), 電子情報通信学会技術研究報告, No. PRMU2011-173, pp. 257-262, Jan. 2012.
井上中順, 篠田浩一. ［特別講演］映像の高性能なセマンティックインデクシングを目指して, 電子情報通信学会パターン認識・メディア理解研究会 (PRMU), 電子情報通信学会技術研究報告, No. PRMU2011-140, pp. 89-94, Dec. 2011.
Sangeeta Biswas, Johan Rohdin, Koichi Shinoda, Sadaoki Furui. Speaker verification using MMAP adaptation, IEICE Speech Technical Committee Meeting, IEICE Technical Report, No. SP2011-93, pp. 133-137, Dec. 2011.
篠田浩一. 映像検索評価ワークショップTRECVID, キャノン（株）イノベイティブ技術フォーラム, キヤノン・イノベイティブ技術フォーラム映像認識技術ワークショップ, Oct. 2011.
古井貞熙, 那須悠, 篠田浩一. GMM尤度補正を用いた耐雑音音声認識, 日本音響学会秋季研究発表会, 日本音響学会2011年秋季研究発表会講演論文集, 日本音響学会, pp. 29-32, Sept. 2011.
大西祥史, 篠田浩一, 越仲孝文. 複数マイクロフォンを用いた音声区間検出, 日本音響学会 2011年秋季研究発表会, 日本音響学会 2011年秋季研究発表会講演論文集, pp. 37-38, Sept. 2011.
Johan Rohdin, Koichi Shinoda. Speaker Adaptation for Dialogue Act Classification, Information Processing Society of Japan, IPSJ SIG Technical Report, Vol. 2011-SLP-87, No. 8, July 2011.
Hilman, Koichi Shinoda, Koji IWANO. Nonlinear Normalization Using q-Logarithm for Robust Speech Recognition, The Institute of Electronics, Information and Communication Engineers, IEICE Technical Report, Vol. 111, No. 153, pp. 45-50, July 2011.
井上中順, 篠田浩一. 木構造GMMを用いたセマンティックインデクシングの高速化, パターン認識・メディア理解研究会, 電子情報通信学会技術研究報告 PRMU, vol. 111, no. 77, pp. 105-110, June 2011.
村上博子, 篠田浩一, 古井貞熙. 音響モデル学習のための相対エントロピーを用いた学習文選択手法, 日本音響学会2011年春季講演発表会, 日本音響学会2011年春季講演論文集, 日本音響学会, No. 1-5-7, pp. 17-20, Mar. 2011.
別府真由美, 篠田浩一, 古井貞熙. 雑音下音声におけるスペクトル縮小の分析とその耐雑音音声認識への利用, 電子情報通信学会技術研究報告, 社団法人電子情報通信学会, SP-2010-122, pp. 43-48, Mar. 2011.
Sangeeta Biswas, Marc Ferras, Koichi Shinoda, Sadaoki Furui. Voting Approach in SMAP Adaptation for Speaker Verification, 日本音響学会2011年春季研究発表会, 日本音響学会2011年春季講演論文集, 日本音響学会, No. 2-5-2, pp. 45-48, Mar. 2011.
篠田浩一, 佐藤真一. 映像解析・検索評価ワークショップTRECVID2010の概要, 電子情報通信学会技術研究報告 PRMU, vol. 110, no. 414, pp. 19-24, Feb. 2011.
井上中順, 上嶋勇祐, 篠田浩一. マルチモーダル・マルチフレームな手法を用いたTRECVIDセマンティックインデクシング, 電子情報通信学会技術研究報告 PRMU, vol. 110, no. 414, pp. 25?30, Feb. 2011.
村上博子, 篠田浩一, 古井貞熙. 音響モデル学習のための相対エントロピーを用いた学習文選択, 情報処理学会研究報告, 情報処理学会, Vol. 2011-SLP-85, No. 3, pp. 1-6, Feb. 2011.
Marc Ferras, Koichi Shinoda, Sadaoki Furui. Inter-speaker weighted MAP adaptation for GMM-supervector speaker recognition, IPSJ Technical Report, Information Processing Society of Japan, Vol. 2010-SLP-84, No. 12, pp. 1-4, Dec. 2010.
Sangeeta Biswas, Marc Ferras, Koichi Shinoda, Sadaoki Furui. Optimal use of trees in structural MAP adaptation for speaker verification, IPSJ Technical Report, Information Processing Society of Japan, Vol. 2010-SLP-84, No. 26, pp. 1-5, Dec. 2010.
山本仁, 花沢健, 三木清一, 篠田浩一. カテゴリ推定に基づく動的な言語モデル適応, 情報処理学会音声言語情報処理研究会 (SLP), Vol. 2010-SLP-84, No. 1, Dec. 2010.
Muhammad Rasyid Aqmar, Koichi Shinoda, Sadaoki Furui. Gait-based Person Identification Robust against Speed Variation using CHLAC features and HMMs, 電子情報通信学会技術研究報告, 社団法人電子情報通信学会, Vol. PRMU2010-92, SP2010-48, WIT2010-36, pp. 23-28, Oct. 2010.
別府真由美, Jean-Luc Rouas, Martine Adda-Decker, 篠田浩一, 古井貞熙. フランス語における発声スタイルの違いがスペクトル特徴に与える影響の分析, 日本音響学会2010年秋季研究発表会, 日本音響学会2010年秋季講演論文集, 日本音響学会, No. 3-1-2, pp. 257-260, Sept. 2010.
井上中順, 上嶋勇祐, 篠田浩一, 古井貞熙. SIFT混合ガウス分布を用いた一般物体認識のためのマルチカーネル学習, 電子情報通信学会技術研究報告, 社団法人電子情報通信学会, Vol. PRMU2010-58, pp. 7-12, Sept. 2010.
那須悠, 篠田浩一, 古井貞熙. 会議音声認識のためのスペクトル減算に基づく音源分離, 日本音響学会2010年秋季研究発表会, 日本音響学会2010年秋季講演論文集, 日本音響学会, No. 3-10-13, pp. 627-630, Sept. 2010.
佐藤新, 篠田浩一, 古井貞熙. ToFカメラによる3D手話認識, 画像の認識・理解シンポジウム, 画像の認識・理解シンポジウム（MIRU2010), 画像の認識・理解シンポジウム, IS3-44, pp. 1861-1868, July 2010.
吉澤悠介, 篠田浩一, 古井貞熙. 局所的な特徴と大局的な特徴を用いた監視カメラ映像からの行動イベント検出, 電子情報通信学会技術研究報告, 社団法人電子情報通信学会, Vol. 2010-43,PMRU2010-31, MI2010-31, pp. 163-168, May 2010.
那須悠, 篠田浩一, 古井貞熙. 会議音声認識のためのスペクトル減算に基づくオンライン音源分離, 電子情報通信学会技術研究報告, 社団法人電子情報通信学会, Vol. EA2010-2, SIP2010-2, SP2010-2, pp. 7-12, May 2010.
斉藤辰彦, 井上中順, 篠田浩一, 古井貞熙. 音響特徴を用いた映像からのイベント検出の研究, 日本音響学会2010年春季研究発表会, 日本音響学会2010年春季講演論文集, 日本音響学会, pp. 201-202, Mar. 2010.
濱中悠三, 江森正, 越中孝文, 篠田浩一, 古井貞煕. 音声認識のための複数の認識器を利用した能動学習, 情報処理学会研究報告, Vol. 2009-SLP-79, No. 4, pp. 1-8, Dec. 2009.
井上中順, 斉藤辰彦, 篠田浩一, 古井貞煕. SIFT混合ガウス分布と音響特徴を用いた映像からの高次特徴検出, 電子情報通信学会技術研究報告, 社団法人電子情報通信学会, Vol. PRMU2009-106, pp. 97-102, Nov. 2009.
濱中悠三, 江森正, 越仲孝文, 篠田浩一, 古井貞熙. 音声認識のためのコミッティを用いた能動学習, 日本音響学会秋季研究発表会, 日本音響学会2009年秋季講演論文集, 日本音響学会, No. 1-1-5, pp. 15-18, Sept. 2009.
村上博子, 篠田浩一, 古井貞熙. 能動的な適応文選択に基づく話者適応化, 日本音響学会 2009年春季研究発表会, 日本音響学会2009年春季講演論文集, pp. 191-194, Mar. 2009.
安井英己, 篠田浩一, 古井貞熙, 岩野公司. ハフ変換による基本周波数情報を用いた耐雑音音声認識の高性能化の検討, 日本音響学会 2009年春季研究発表会, 日本音響学会2009年春季講演論文集, pp. 35-38, Mar. 2009.
山崎航史, 篠田浩一, 古井貞熙. 統計的モデル選択によるシーン数の自動推定を用いた動画要約, 電子情報通信学会技術研究報告, 社団法人電子情報通信学会, Vol. PRUM2008-231, pp. 139-144, Feb. 2009.
MUHAMMAD RASYID, Koichi Shinoda, SADAOKI FURUI. Gait Recognition Using CHLAC Features and Hidden Markov Model, IEICT Tachnical Report, 社団法人電子情報通信学会, Vol. PRUM2008-224, pp. 99-103, Feb. 2009.
安井英己, 篠田浩一, 古井貞熙, 岩野公司. 耐雑音音声認識のためのハフ変換による基本周波数情報抽出の高速化, 電子情報通信学会技術研究報告, 社団法人電子情報通信学会, Vol. SP2008-129, No. 2009-1, pp. 19-24, Jan. 2009.
安井英巳, 岩野公司, 篠田浩一, 古井貞熙. スペクトルサブトラクションとハフ変換による基本周波数情報を用いた耐雑音音声認識, 日本音響学会秋季研究発表会, 日本音響学会2008年秋季講演論文集, 日本音響学会, No. 1-1-2, p. 3-6, Sept. 2008.
中村太一, 篠田浩一, 古井貞熙. 木構造クラスタリングを用いた動画像からの高次特徴抽出, 電子情報通信学会技術研究報告no.491, 社団法人電子情報通信学会, PRMU2007-220, No. 491, pp. 37-42, Mar. 2008.
渡邉康司, 篠田浩一, 古井貞熙. 音声とペンの同時入力における個人差への適応化, 日本音響学会春季研究発表会, 日本音響学会2008年春季講演論文集, 日本音響学会, No. 2-4-11, p. 55-58, Mar. 2008.
岩田憲治, 篠田浩一, 古井貞熙. 連続音素認識を用いた単語認識誤りに頑健な講演音声検索, 日本音響学会春季研究発表会, 日本音響学会2008年春季講演論文集, 日本音響学会, No. 2-10-20, pp. 113-116, Mar. 2008.
Kousuke Hiraki, Takahiro Shinozaki, Koji Iwano, Agnieszka Betkowska, Betkowska Agnieszka, Koichi Shinoda, SADAOKI FURUI. Initial Evaluation of the Drivers' Japanese Speech Corpus in a Car Environment, 電子情報通信学会技術研究報告, Vol. SP2007-202, pp. 93-98, Mar. 2008.
丹治秀太朗, 篠田浩一, 古井貞熙, オルテガアントニオ. パラメータ空間のクラスタ化による固有声話者適応化の改良, 日本音響学会春季研究発表会, 日本音響学会2008年春季講演論文集, 日本音響学会, No. 2-10-11, pp. 91-94, Mar. 2008.
江森正, 大西祥史, 篠田浩一. 音声認識における確率モデルの重み係数の自動推定, 電子情報通信学会技術研究報告, 社団法人電子情報通信学会, PRUM2007-104, pp. 49-54, Dec. 2007.
谷真宏, 江森正, 大西祥史, 越仲孝文, 篠田浩一. 十分統計量を用いた教師なし話者適応における話者選択法, 電子情報通信学会技術研究報告, 社団法人電子情報通信学会, PRUM2007-110, pp. 85-90, Dec. 2007.
望月貴裕, 藤井真人, 八木伸行, 篠田浩一. 数値列化したイベントシーンの学習と試合進行状況情報による制約条件を用いた野球映像イベント識別, 電子情報通信学会技術研究報告, 社団法人電子情報通信学会, PRUM2007-149, pp. 77-82, Dec. 2007.
閔庚甫, 篠田浩一, 古井貞熙. ハイブリッドモデルに基づく単視点ビデオデータにおける人間の歩行動作のトラッキング, 電子情報通信学会技術研究報告, 社団法人電子情報通信学会, WIT2007-24, pp. 47-52, Aug. 2007.
安藤亮一, 篠田浩一, 古井貞熙, 望月貴裕. 時系列データに対するデータ駆動型アプローチに基づく野球放送の頑健なシーン認識, 画像の認識・理解シンポジウム（MIRU 2007）IS-1-17, 画像の認識・理解シンポジウム（MIRU 2007）IS-1-17, 画像の認識・理解シンポジウム（MIRU 2007）, pp. 570-575, July 2007.
宮村祐一, 中村太一, 篠田浩一, 古井貞熙. 多段SVMを用いた頑健な動画ショット境界検出, 画像の認識・理解シンポジウム（MIRU 2007）IS-2-19, 画像の認識・理解シンポジウム（MIRU 2007）IS-2-19, 画像の認識・理解シンポジウム（MIRU 2007）, pp. 815-820, July 2007.
石原一樹, 安藤亮一, 篠田浩一, 古井貞煕, 望月貴裕. 野球放送のためのデータ駆動型アプローチを用いた得点シーン検出, 第13回画像センシングシンポジウム, 第13回画像センシングシンポジウム予稿集, 画像センシング技術研究会, pp. 513-518, June 2007.
山崎裕紀, 岩野公司, 篠田浩一, 古井貞熙, 横田治夫. スライド資料を用いた講義音声認識のための言語モデル適応, 日本音響学会, 日本音響学会2007年春季講演論文集, 3-9-8, pp. 79-80, Mar. 2007.
山崎裕紀, 岩野公司, 篠田浩一, 古井貞熙, 横田治夫. 講義音声認識における講義スライド情報の利用, 電子情報通信学会, 電子情報通信学会技術報告, Vol. SP2006-122, pp. 43-48, Dec. 2006.
岩田憲治, 渡邉康司, 中川竜太, 篠田浩一, 古井貞熙. 音声とペンの準同期入力に対するマルチモーダル認識, 日本音響学会 2006年秋季講演, 日本音響学会 2006年秋季講演論文集, pp. 45-46, Sept. 2006.
渡邉康司, 岩田憲治, 中川竜太, 篠田浩一, 古井貞熙. 音声とペン入力の同時入力に対する認識方式の検討, 電子情報通信学会音声研究会, 電子情報通信学会技術研究報告, Vol. SP2006-19, pp. 49-54, June 2006.
安藤亮一, 篠田浩一, 古井貞熙, 望月貴裕. 動画像インデクシングのためのシーン時系列の確率的言語モデル, 第12回画像センシングシンポジウ, 第12回画像センシングシンポジウム予稿集, 画像センシング技術研究会, pp. 513-518, June 2006.
閔庚甫, 篠田浩一, 古井貞熙. ビデオ画像における人間の歩行動作の3次元トラッキング, 電子情報通信学会パターン認識・メディア理解研究会, 電子情報通信学会技術研究報告, Vol. PRMU2006-2, pp. 7-12, May 2006.
宮崎太郎, 中川弘充, 中川竜太, 岩野公司, 篠田浩一, 古井貞熙. 野球中継番組を対象とした音響情報を用いたシーン認識, 日本音響学会2006年春季講演論文集, pp. 19-20, Mar. 2006.
Betkowska Agnieszka, Koichi Shinoda, Sadaoki Furui. Family Adaptation of Factorial HMMs for Personal Robots, 日本音響学会 2006年春季講演, 日本音響学会2006年春季講演論文集, pp. 135-136, Mar. 2006.
小林隆二, 篠田浩一, 古井貞熙. 基本周波数情報のグラフィカルモデリングによる音声認識, 2006年日本音響学会春季研究発表会, 2006年日本音響学会春季講演論文集, 日本音響学会, pp. 39-40, Mar. 2006.
小林隆二, 篠田浩一, 古井貞熙. 基本周波数情報を用いたダイナミックベイジアンネットワークによる音声認識, 電子情報通信学会音声研究会, 電子情報通信学会技術研究報告, 社団法人電子情報通信学会, Vol. SP2005-197, pp. 77-82, Mar. 2006.
Agnieszka Betkowska, Koichi Shinoda, Sadaoki Furui. Recognition of speech in non-stationary noise using Factorial HMMs, 日本音響学会2005年秋季研究発表会, 日本音響学会2005年秋季講演論文集, 日本音響学会, No. 3-7-25, pp. 151-152, Sept. 2005.
中川竜太, 小林唯, 小林隆二, 篠田浩一, 古井貞熙. 音声と手書き文字の同時入力によるインターフェースの検討, 日本音響学会2005年秋季研究発表会, 日本音響学会2005年秋季講演論文集, 日本音響学会, No. 1-7-11, pp. 13-14, Sept. 2005.
Nguyen Huu Bach, 篠田浩一, 古井貞煕. 隠れマルコフモデルを用いた野球放送の自動的インデクシング, 画像の認識・理解シンポジウム(MIRU2005), 画像の認識・理解シンポジウム(MIRU2005), 画像の認識・理解シンポジウム,MIRU, pp. 1113-1120, July 2005.
Nguyen Huu Bach, 篠田浩一, 古井貞煕. 隠れマルコフモデルとMLLRによるゲーム適応を用いた野球放送の自動インデクシング, 第11回画像センシングシンポジウム, 第11回画像センシングシンポジウム講演論文集, pp. 7-10, June 2005.
中川竜太, 小林唯, 小林隆二, 篠田浩一, 古井貞熙. 音声と手書き文字の同時入力インターフェース, 情報処理学会音声言語情報処理研究会, 情報処理学会研究報告, Vol. 2005, No. SLP-56, pp. 29-34, May 2005.
Agnieszka Betkowska, Koichi Shinoda, Sadaoki Furui. Noise discrimination using models with different structures, 日本音響学会2005年春季研究発表会, 日本音響学会 2005年春季講演論文集, 日本音響学会, No. 2-Q-7, pp. 111-112, Mar. 2005.
小林隆二, 篠田浩一, 古井貞熙. 弁別素性のグラフィカルモデリングによる音声認識, 音声音響学会2005年春季研究発表会, 日本音響学会2005年春季講演論文集, 音声音響学会, No. 1-5-21, pp. 41-42, Mar. 2005.
Nguyen Huu Bach, 篠田浩一, 古井貞熙. 隠れマルコフモデルを用いた野球放送の自動的インデクシング, 電子情報通信学会技術研究報告, Vol. PRMU2004, No. 107, pp. 13-19, Nov. 2004.
Agnieszka Betkowska, Koichi Shinoda, Sadaoki Furui. A study of noise discrimination for personal robots, 日本音響学会 2004年秋季研究発表会, 日本音響学会 2004年秋季講演論文集, 日本音響学会, No. 1-1-6, pp. 11-12, Sept. 2004.
Nguyen Huu Bach, 篠田浩一, 古井貞煕. 隠れマルコフモデルを用いた野球放送の自動インデキシング, 電子情報通信学会パターン認識・メディア理解研究会, 日本音響学会 2004年秋季講演論文集, pp. 11-12, Sept. 2004.
市屋剛, 中川竜太, 篠田浩一, 古井貞熙. 手書き文字の準同期入力を併用した音声認識手法の予備検討, 電子情報通信学会 2004年総合大会, 電子情報通信学会 2004年総合大会, No. D-14-007, pp. 148, Mar. 2004.
Nguyen Huu Bach, 篠田浩一, 古井貞熙. 動的特徴量を用いたHMMによる連続動作認識, 電子情報通信学会 2004年総合大会, No. D-12-120, pp. 286, Mar. 2004.
藤崎宣彦, 篠田浩一, 岩野公司, 古井貞熙. パーソナルロボット向けの家庭内雑音に頑健な音声認識の検討, 日本音響学会 2003年秋季研究発表会, 日本音響学会2003年秋季研究発表会講演論文集, 日本音響学会, Vol. 1, No. 1-6-11, pp. 21-22, Sept. 2003.
篠田浩一. 確率モデルによる多声楽曲MIDI演奏からの楽譜推定, 情報処理学会研究報告, 情報処理学会研究報告, Vol. 2003-MUS-50, pp. 27-32, May 2003.
五十川賢造, 西本卓也, 篠田浩一, 嵯峨山茂樹. 品詞情報と単語内位置情報を用いた話し言葉音声認識のための状態クラスタリング, 日本音響学会平成15年春季研究発表会講演論文集, Vol. 1-4-4, pp. 7-8, Mar. 2003.
篠田浩一. ハーモニッククラスタリングによる多重音基本周波数推定アルゴリズム, 情報処理学会研究報告, 情報処理学会研究報告, Mar. 2003.
山本仁, 西本卓也, 篠田浩一, 嵯峨山茂樹. モデル適応と音響尤度補正を併用した雑音に頑健な音声認識, 日本音響学会平成15年春季研究発表会講演論文集, Vol. 1-4-18, pp. 41-42, Mar. 2003.
亀岡弘和, 西本卓也, 篠田浩一, 嵯峨山茂樹. ハーモニッククラスタリングによる多重音基本周波数推定, 日本音響学会平成15年春季研究発表会講演論文集, Vol. 3-7-3, pp. 837-838, Mar. 2003.
武田晴登, 西本卓也, 篠田浩一, 嵯峨山茂樹. HMMを用いた多声部MIDI信号からの楽譜復元, 日本音響学会平成15年春季研究発表会講演論文集, Vol. 3-7-4, pp. 839-840, Mar. 2003.
亀岡弘和, 篠田浩一, 嵯峨山茂樹. スペクトル領域のDPマッチングによる自然楽器演奏の多重音解析, 日本音響学会平成14年秋季研究発表会講演論文集, Vol. 1-1-2, Sept. 2002.
武田晴登, 篠田浩一, 嵯峨山茂樹. リズムベクトルを用いたHMMによる単旋律MIDI演奏の楽譜化, 日本音響学会平成14年秋季研究発表会講演論文集, Vol. 1-1-5, Sept. 2002.
山本仁, 篠田浩一, 嵯峨山茂樹. 正規分布の尤度補正による突発性雑音に頑健な音声認識, 日本音響学会平成14年秋季研究発表会講演論文集, Vol. 1-9-10, Sept. 2002.
武田晴登, 篠田浩一, 嵯峨山茂樹. リズムベクトルの概念に基づくMIDI演奏の音価認識, 情報処理学会研究報告, 情報処理学会研究報告, Vol. 2002-MUS-46, pp. 23-28, July 2002.
亀岡弘和, 篠田浩一, 嵯峨山茂樹. 周波数領域のDPマッチングによる自然楽器演奏の和音ピッチ推定, 情報処理学会研究報告, 情報処理学会研究報告, Vol. 2002-MUS-46, pp. 17-22, July 2002.
山本仁, 篠田浩一, 嵯峨山茂樹. ガウス分布の補正による突発性雑音に頑健な音声認識, 電子情報通信学会技術研究報告, Vol. SP2002-45, June 2002.
五十川賢造, 篠田浩一, 嵯峨山茂樹. LSP周波数間隔とCSM強度対を用いた音声認識の検討, 電子情報通信学会技術研究報告, Vol. SP2002-42, June 2002.
篠田浩一, 磯健一. MDL基準を用いたHMMサイズの削減, 日本音響学会2002年春季研究発表会, 日本音響学会2002年春季研究発表会講演論文集, 2-5-3, pp. 79-80, Mar. 2002.
板垣貴裕, 篠田浩一, 嵯峨山茂樹. 話し言葉音声の認識における間投詞の話者性を考慮した言語モデル, 第2回話し言葉の科学と工学ワークショップ講演予稿集, pp. 79-84, Feb. 2002.
五十川賢造, 篠田浩一, 嵯峨山茂樹. CSM強度対を用いた音声認識, 日本音響学会2002年春季研究発表会, 日本音響学会平成14年春季研究発表会講演論文集, Vol. 1-5-4, pp. 7-8, 2002.
篠田浩一. 話者適応(サーベイ), 第3回音声言語シンポジウム, 第3回音声言語シンポジウム講演論文集, Dec. 2001.
Koichi Shinoda, Dieu Tran, 磯健一. Efficient Reduction of Gaussian Components Using MDL Criterion for Speech Recognition, 電子情報通信学会技術研究報告, vol. 101, no. 352, pp. 69-76, Oct. 2001.
篠田浩一, Dieu Tran, 磯健一. 音声認識のためのMDL基準を用いた効果的なガウス数削減, SP, 信学技報, pp. 69-76, 2001.
江森正, 篠田浩一. 音声認識のための高速最ゆう推定を用いた声道長正規化, 電子情報通信学会技術研究報告(第1回音声言語シンポジウム), 電子情報通信学会技術研究報告(第1回音声言語シンポジウム), Vol. SP99-101, No. 108, pp. 49-54, Dec. 1999.
篠田浩一. MDL基準を用いた音声認識単位の自動生成, 視聴覚情報研究会(AVIRG)例会, 視聴覚情報研究会(AVIRG)例会予稿, Sept. 1999.
Koichi Shinoda, Chin-Hui Lee. Acoustic Model Adaptation using Structural Bayes Approach, 日本音響学会講演論文集, pp. 47-48, Sept. 1998.
花沢健, 篠田浩一. 事後確率最大化手法を用いた言語モデルの学習, 日本音響学会平成10年度秋季研究発表会, 日本音響学会平成10年度秋季研究発表会講演論文集, Vol. 2-1-21, 1998.
高木啓三郎, 篠田浩一, 服部浩明, 渡辺隆夫. 雑音環境を考慮した自律型話者適応化, 日本音響学会平成8年度春季研究発表会, 日本音響学会平成8年度春季研究発表会講演論文集, Vol. 1-5-24, 1996.
篠田浩一, 渡辺隆夫. 情報量基準を用いた状態クラスタリングによる音響モデルの生成, 電子情報通信学会技術研究報告, 電子情報通信学会技術研究報告, Vol. SP96-79, 1996.
篠田浩一, 渡辺隆夫. 情報量基準を用いた音声認識単位の自動生成, 日本音響学会平成8年度秋季研究発表会, 日本音響学会平成8年度秋季研究発表会講演論文集, Vol. 2-3-11, 1996.
篠田浩一, 坂井信輔, 磯健一, 畑崎香一郎, 渡辺隆夫, 水野正典. パソコンソフト連続音声認識, 情報処理学会第50回(平成7年度前期)全国大会, 情報処理学会第50回(平成7年度前期)全国大会講演論文集, Vol. 2-465, Mar. 1995.
高木啓三郎, 篠田浩一, 服部浩明, 渡辺隆夫. 雑音環境の変動を考慮した話者適応化, 電子情報通信学会技術研究報告, 電子情報通信学会技術研究報告(第1回音声言語シンポジウム), Vol. SP95-100, 1995.
磯健一, 篠田浩一, 坂井信輔, 畑崎香一郎, 渡辺隆夫, 水野正典. パソコン向けソフトウェア連続音声認識, 電子情報通信学会総合大会, 電子情報通信学会総合大会講演論文集, Vol. SD-9-4, 1995.
篠田浩一, 渡辺隆夫. 木構造化された確率分布を用いた話者適応化, 日本音響学会平成7年度春季研究発表会, 日本音響学会平成7年度春季研究発表会講演論文集, Vol. 2-5-10, 1995.
篠田浩一, 渡辺隆夫. 記述長最小原理を用いた話者適応化, 日本音響学会平成7年度秋季研究発表会, 日本音響学会平成7年度秋季研究発表会講演論文集, Vol. 3-2-12, 1995.
篠田浩一, 渡辺隆夫. 半音節HMMを用いた音声認識のための教師なし適応化, 日本音響学会平成6年度春季研究発表会, 日本音響学会平成6年度春季研究発表会講演論文集, Vol. 3-7-8, 1994.
篠田浩一, 坂井信輔, 磯健一, 畑崎香一郎, 渡辺隆夫, 水野正典. パソコン向けソフトウェア連続音声認識, 日本音響学会平成6年度秋季研究発表会, 日本音響学会平成6年度秋季研究発表会講演論文集, Vol. 2-8-3, 1994.
古賀真二, 篠田浩一, 高木啓三郎, 渡辺隆夫, 吉田和永, 塚田聡. 半音節単位認識による大語彙音声入力装置の開発, 日本音響学会平成6年度秋季研究発表会, 日本音響学会平成6年度秋季研究発表会講演論文集, Vol. 2-8-7, 1994.
古賀真二, 塚田聡, 篠田浩一, 野口淳, 畑崎香一郎, 渡辺隆夫, 友岡靖夫, 赤井善裕, 幅崎直行, 羽金広. 大語彙音声入力装置の開発, 電子情報通信学会秋季大会, 電子情報通信学会秋季大会講演論文集, Vol. D-392, 1994.
畑崎香一郎, 磯健一, 高木啓三郎, 篠田浩一, F. Ehsani, 野口淳, 坂井信輔, 山田栄子, 服部浩明, 渡辺隆夫. パソコン向け音声認識ソフトウエア, 情報処理学会平成5年度後期全国大会, 情報処理学会平成5年度後期全国大会講演論文集, Vol. 2-375, 1993.
磯健一, 高木啓三郎, 篠田浩一, 山田栄子, 服部浩明, F. Ehsani, 野口淳, 古賀真二, 畑崎香一郎, 渡辺隆夫. パソコン向けソフトウェア音声認識, 日本音響学会平成5年度秋季研究発表会, 日本音響学会平成5年度秋季研究発表会講演論文集, Vol. 2-Q-21, 1993.
高木啓三郎, 篠田浩一, 渡辺隆夫. 音声認識のための入力環境の適応化, 日本音響学会平成5年度春季研究発表会, 日本音響学会平成5年度春季研究発表会講演論文集, Vol. 1-4-22, 1993.
渡辺隆夫, 篠田浩一, 高木啓三郎, 山田栄子, 服部浩明. 木構造確率分布を用いた音声認識, 日本音響学会平成5年度秋季研究発表会, 日本音響学会平成5年度秋季研究発表会講演論文集, Vol. 1-8-7, 1993.
篠田浩一, 渡辺隆夫. 話者適応化における学習語彙依存性の改善, 日本音響学会平成4年度秋季研究発表会, 日本音響学会平成4年度秋季研究発表会講演論文集, Vol. 2-5-7, 1992.
磯谷亮輔, 渡辺隆夫, 畑崎香一郎, 永野敬子, 篠田浩一, 田海真一, M. Chong. 英語不特定話者連続音声認識の試作, 日本音響学会平成4年度春季研究発表会, 日本音響学会平成4年度春季研究発表会講演論文集, Vol. 1-P-10, 1992.
篠田浩一, 渡辺隆夫. 音声認識のためのタスク適応化, 日本音響学会平成4年度春季研究発表会, 日本音響学会平成4年度春季研究発表会講演論文集, Vol. 1-P-15, 1992.
篠田浩一, 磯健一, 渡辺隆夫. 半音節HMMによる音声認識のための話者適応, 日本音響学会平成2年度秋季研究発表会, 日本音響学会平成2年度秋季研究発表会講演論文集, Vol. 1-8-12, 1990.

その他の論文・著書など

篠田浩一, 瀧口吉郎, 小川一人, 佐野雅規, 内藤整, 藤井俊彰. 論文誌10年の記録 2010年～2019年, 映像情報メディア学会誌 2020年9月号, Vol. 74, No. 5, pp. 813~817, Sept. 2020.
相澤清晴, 佐藤真一, 柳井啓司, 井出一郎, 山崎俊彦, 入江豪, 小川貴弘, 望月貴裕, 新田直子, 篠田浩一, 呉志鵬, 松井勇佑, 牛久祥孝, 内田祐介. ICMR2018 国際会議開催側の視点も交えて, 映像情報メディア学会誌, Vol. 72, No. 6, Nov. 2018.
篠田浩一. 音声言語処理における深層学習：総説, 日本音響学会誌, 日本音響学会, vol. 73, no. 1, pp. 25-30, Dec. 2016.
Koichi Shinoda, Jen-Tzung Chien. Machine Learning for Multimedia Sequential Pattern Recognition, 2013 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, 2013 APSIPA Tutorial #5, Oct. 2013.
Koichi Shinoda, Florian Metze. What speech researchers should know about video technology!, INTERSPEECH2013, Tutorial at INTERSPEECH2013, Aug. 2013. 公式リンク
越仲孝文, 篠田浩一. 話者認識の国際動向, 日本音響学会誌, vol. 69, no. 7, pp. 342-348, July 2013.
Koichi Shinoda, Nakamasa Inoue. Reusing Speech Techniques for Video Semantic Indexing, IEEE signal processing magazine, Vol. 30, No. 2, pp. 118-122, Mar. 2013.
篠田浩一. 映像検索技術の新たな潮流, 電子情報通信学会誌, 電子情報通信学会, Vol. 95, No. 10, pp. 932-938, Oct. 2012.
篠田浩一. 音声認識における転移学習：話者適応, 人工知能学会誌, 社団法人人工知能学会, vol. 27, no. 4, pp. 359-364, July 2012.
井上中順, 篠田浩一. フレッシュアイズ映像研究現場紹介東京工業大学篠田研究室, 映像情報メディア学会誌, Vol. 63, No. 8, pp. 1116-1119, 2009.
篠田浩一, 篠崎隆宏. 音声情報処理技術の最先端: 2.統計的手法を用いた音声モデリングの高度化とその音声認識への応用, 情報処理学会学会誌, 情報処理学会, Vol. 45, No. 10, pp. 1012-1019, Oct. 2004.

特許など

佐藤育郎, CERVANTESBAQUE Pablo Alberto, 篠田浩一, 関川　雄介. 情報処理装置、情報処理方法およびプログラム. 特許. 公開. 国立大学法人東京工業大学, 株式会社デンソーアイティーラボラトリ. 2021/05/14. 特願2021-082514. 2022/11/25. 特開2022-175810. 2022.
篠田浩一, 浅見　太一. 音声認識誤り単語検出装置、方法及びプログラム. 特許. 公開. 国立大学法人東京工業大学, 日本電信電話株式会社. 2015/07/07. 特願2015-135868. 2017/01/26. 特開2017-021062. 2017.

学位論文

A Study on robustness against data insufficiency for speech recognition, 本文, Doctor of Engineering, Tokyo Institute of Technology, 2001/03/31,
A study on robustness against data insufficiency for speech recognition, Thesis, Doctor (Engineering), Tokyo Institute of Technology, 2001/03/31, (Organization name: Tokyo Institute of Technology)

[ BibTeX 形式で保存 ] [ 論文・著書をCSV形式で保存 ] [ 特許をCSV形式で保存 ]

Home

各種検索

サポート

T2R2について

関連リンク

篠田浩一研究業績一覧 (487件)

論文

著書

国際会議発表 (査読有り)

国際会議発表 (査読なし・不明)

国内会議発表 (査読なし・不明)

その他の論文・著書など

特許など

学位論文

Home

各種検索

サポート

T2R2について

関連リンク

篠田浩一 研究業績一覧 (487件)

論文

著書

国際会議発表 (査読有り)

国際会議発表 (査読なし・不明)

国内会議発表 (査読なし・不明)

その他の論文・著書など

特許など

学位論文

篠田浩一研究業績一覧 (487件)