2024/03/19 更新

写真a

コサカ テツオ
小坂 哲夫
KOSAKA Tetsuo
職名
教授

研究分野

  • 情報通信 / 知覚情報処理

出身大学

  • 東北大学  工学部  電気工学科

    1984年03月,卒業

出身大学院

  • 東北大学  工学研究科  情報工学専攻

    修士課程,1986年03月,修了

取得学位

  • 博士(情報科学),東北大学,1997年04月

学外略歴

  • キヤノン株式会社,主幹研究員,1986年04月 ~ 2002年08月

  • ATR自動翻訳電話研究所,研究員,1991年09月 ~ 1995年03月

  • MITコンピュータサイエンス研究所,研究員,1994年05月 ~ 1994年08月

所属学会・委員会

  • 日本音響学会

  • 電子情報通信学会

  • W3C Voice Browser Working Group

  • IEEE Senior Member

  • 情報処理学会

 

研究テーマ

  • 音声情報処理(音声認識,音声合成,声質変換,音声強調など),マルチモーダル・ユーザインタフェース,機械学習の応用

論文

  • Simultaneous Adaptation of Acoustic and Language Models for Emotional Speech Recognition Using Tweet Data,IEICE Trans. Information ans Systems,E107-D(3) 363-373,2024年03月

    Tetsuo Kosaka, Kazuya Saeki, Yoshitaka Aizawa, Masaharu Kato, Takashi Nose

    共著(国内のみ)

  • Speech emotion recognition by late fusion of linguistic and acoustic features using deep learning models,Proc. of APSIPA ASC 2023,1013-1018,2023年11月

    Kiyohide Sato, Keita Kishi, Tetsuo Kosaka

    共著(国内のみ)

  • Frequency resolution improvement by sub-bins and an inverse matrix in discrete Fourier transform,Applied optics,62(25) 6614-6624,2023年08月

    Manabu Sato, Shunta Nakabayashi, Ryusei Ito, Junpei Masuta, Tetsuo Kosaka

    共著(国内のみ)

  • Emotion recognition combininb acoustic and linguistic features based on speech recognition results,Proc. of 2021 IEEE 10th Global Conference on Consumer Electronics,889-892,2021年10月

    Misaki Sakurai, Tetsuo Kosaka

    共著(国内のみ)

  • Improvement of frequency resolution using a sub-bin structure in the discrete Fourier transform,Applied optics,60(21) 6290-6301,2021年07月

    Manabu Sato, Yuuki Kimura, Junpei Masuta, Tetsuo Kosaka, Izumi Nishidate

    共著(国内のみ)

  • Language Model Adaptation for Emotional Speech Recognition using Tweet Data,Proc. of APSIPA ASC 2020,371-375,2020年12月

    Kazuya Saeki, Masaharu Kato, Tetsuo Kosaka

    共著(国内のみ)

  • Performance Improvement of Prosody-Controlled Voice Conversion by Language Model Adaptation,Proc. of 2019 IEEE 8th Global Conference on Consumer Electronics,854-856,2019年10月

    Kazuya Saeki, Masaharu Kato, Tetsuo Kosaka

    共著(国内のみ)

  • Investigation of Acoustic Models for Emotion Recognition Using a Spontaneous Speech Corpus,Proc. of 23nd International Congress on Acoustics,0300,2019年09月

    Tetsuo Kosaka, Yuka Haneda, Daisuke Makabe, Masaharu Kato,

    共著(国内のみ)

  • Acoustic Model Adaptation for Emotional Speech Recognition Using Twitter-Based Emotional Speech Corpus,Proc. of APSIPA ASC 2018,1747-1751,2018年11月

    Tetsuo Kosaka, Yoshitaka Aizawa, Masaharu Kato, Takashi Nose

    共著(国内のみ)

  • Improving Voice Activity Detection for Multimodal Movie Dialogue Corpus,Proc. of 2018 IEEE 7th Global Conference on Consumer Electronics,453-456,2018年10月

    Tetsuo Kosaka, Ikumi Suga, Masashi Inoue

    共著(国内のみ)

  • ディープニューラルネットワークを用いた教師なしクロス適応による音声認識,電子情報通信学会論文誌,J101-D(8) 1190-1199,2018年08月

    冨田建斗,高木瑛,加藤正治,小坂哲夫

    共著(国内のみ)

  • Multimodal Spoken Dialog System Using State Estimation by Body Motion,Proc. of 2017 IEEE 6th Global Conference on Consumer Electronics,348-351,2017年10月

    Takeru Koseki, Tetsuo Kosaka

    共著(国内のみ)

  • Many-to-many voice conversion using hidden Markov model-based speech recognition and synthesis,5th Joint Meeting of the Acoustical Society of America and Acoustical Society of Japan,2016年12月

    Y. Aizawa, M. Kato and T. Kosaka

    共著(国内のみ)

  • Voice activity detection in movies using multi-class deep neural networks,5th Joint Meeting of the Acoustical Society of America and Acoustical Society of Japan,2016年12月

    I. Suga, R. Yasuhara, M. Inoue and T. Kosaka

    共著(国内のみ)

  • Large-scale multimodal movie dialogue corpus,Proc. of the 18th ACM International Conference on Multimodal Interaction,414-415,2016年11月

    Ryu Yasuhara, Masashi Inoue, Ikumi Suga and Tetsuo Kosaka

    共著(国内のみ)

  • Voice Conversion of emotional speech using hidden Markov model-based speech recognition and synthesis,Proc. of 22nd International Congress on Acoustics,0300,2016年09月

    Tetsuo Kosaka, Yoshiaki Nakagawa and Masaharu Kato

    共著(国内のみ)

  • Deep Neural Network-Based Speech Recognition with Combination of Speaker-Class Models,Proc. of APSIPA ASC 2015,SP2-2.3,2015年12月

    Tetsuo Kosaka, Kazuki Konno, Masaharu Kato

    共著(国内のみ)

  • Unsupervised cross-adaptation using language model and deep learning based acoustic model adaptations,Proc. of APSIPA ASC 2014,WA-P-16,2014年12月

    Akira Takagi, Kazuki Konno, Masaharu Kato and Tetsuo Kosaka

    共著(国内のみ)

  • Elements of difficulty level in Mathematics,International Conference on Software EngineeriProc. of Artificial Intelligence, Networking and Parallel/Distributed Computing ,85-97,2014年06月

    Taku Jiromaru, Tetsuo Kosaka, Tokuro Matsuo

    共著(国内のみ)

  • 話者クラス音響モデル及び単語グラフ統合を用いた音声認識,電子情報通信学会論文誌,J96-D(11) 2795-2803,2013年11月

    小坂哲夫,伊藤貴,加藤正治 ,好田正紀

    共著(国内のみ)

  • Speech recognition with large-scale speaker-class-based acoustic modeling,Proc. of APSIPA ASC 2013, OS.28-SLA.9,2013年10月

    Kazuki Konno, Masaharu Kato and Tetsuo Kosaka

    共著(国内のみ)

  • An investigation of vowel substitution rules in the automatic evaluation system of English pronunciation,Proc. of Meetings on Acoustics ,2013年06月

    Kei Sato, Masaharu Kato and Tetsuo Kosaka

    共著(国内のみ)

  • A time-synchronous histogram equalization for noise robust speech recognition,Proc. of Meetings on Acoustics,2013年06月

    Fumiya Takahashi, Masaharu Kato and Tetsuo Kosaka

    共著(国内のみ)

  • 識別学習を用いた離散混合分布HMMによる音声認識,情報処理学会論文誌,54(2) 436-442,2013年02月

    小坂哲夫,加藤正治

    共著(国内のみ)

  • Unsupervised Cross-Adaptation Approach for Speech Recognition by Combined Language Model and Acoustic Model Adaptation,Proc. of APSIPA ASC 2011,2011年10月

    Tetsuo Kosaka, Taro Miyamoto, Masaharu Kato

    共著(国内のみ)

  • Speaker Vector-Based Verification by Phonetic Class-Based Modeling,Journal of Information Assurance and Security,6(3) 186-194,2011年03月

    Tetsuo Kosaka, Naoki Tadokoro, Masaharu Kato, Masaki Kohda

    共著(国内のみ)

  • Lecture Speech Recognition Using Discrete-Mixture HMMs,IEEJ Transactions on Electrical and Electronic Engineering,6(1) 23-29,2011年01月

    Tetsuo Kosaka, Akiyoshi Yamamoto, Takuya Kumakura, Masaharu Kato, Masaki Kohda

    共著(国内のみ)

  • Unsupervised Speaker Adaptation Using Speaker-Class Models for Lecture Speech Recognition,IEICE Transactions on Information and Systems,E93-D(9) 2363-2369,2010年09月

    Tetsuo Kosaka, Yuui Takeda, Takashi Ito, Masaharu Kato, Masaki Kohda

    共著(国内のみ)

  • Lecture Speech Recognition by Combining Word Graphs of Various Acoustic Models,Proc. of Interspeech 2010,2978-2981,2010年09月

    Tetsuo Kosaka, Keisuke Goto, Takashi Ito and Masaharu Kato

    共著(国内のみ)

  • Speaker Adaptation Based on System Combination Using Speaker-Class Models,Proc. of Interspeech 2010,546-549,2010年09月

    Tetsuo Kosaka, Takashi Ito, Masaharu Kato, Masaki Kohda

    共著(国内のみ)

  • Performance Improvement in Automatic Evaluation System of English Pronunciation by Using Various Normalization Methods,Proc. of ICA2010,#257,2010年08月

    Masaru Kusumi, Masaharu Kato, Tetsuo Kosaka, Itaru Matsunaga

    共著(国内のみ)

  • Speech Recognition in Noise by Using Word Graph Combinations,Proc. of ICA2010,#341,2010年08月

    Shunsuke Kuramata, Masaharu Kato, Tetsuo Kosaka

    共著(国内のみ)

  • An Algorithm for Fast Calculation of Back-off N-gram Probabilities with Unigram Rescaling,IAENG International Journal of Computer Science,36(4) 284-288,2009年11月

    Masaharu Kato, Tetsuo Kosaka, Akinori Ito and Shozo Makino

    共著(国内のみ)

  • Noisy Speech Recognition by using Output Combination of Discrete-Mixture HMMs and Continuous-Mixture HMMs,Proc. of Interspeech 2009,2379-2382,2009年09月

    Tetsuo Kosaka, You Saito and Masaharu Kato

    共著(国内のみ)

  • An Improvement of Speaker Vector-Based Speaker Verification,Proc. of International Conference on Information Assurance and Security,721-724,2009年08月

    Naoki Tadokoro, Tetsuo Kosaka, Masaharu Kato and Masaki Kohda

    共著(国内のみ)

  • Fast and Robust Training of a Probabilistic Latent Semantic Analysis Model by the Parallel Learning and Data Segmentation,Journal of Communication and Computer,6(5) 28-35,2009年05月

    Masaharu Kato, Tetsuo Kosaka, Akinori Ito and Shozo Makino

    共著(国内のみ)

  • Dictation of Japanese speech based on Kana and Kanji character string,International Journal of Computer Processing of Languages,22(1) 75-98,2009年03月

    AKINORI ITO, HIROAKI KINNO, MASAHARU KATOH, TETSUO KOSAKA and MASAKI KOHDA

    共著(国内のみ)

  • An Investigation on Speaker Vector-based Speaker Identification under Noisy Conditions,Proc. of International Conference on Audio, Language and Image Processing 2008,1430-1435,2008年07月

    Yuki Goto, Tatsuya Akatsu, Masaharu Katoh, Tetsuo Kosaka and Masaki Kohda

    共著(国内のみ)

  • Histogram Equalization for Noise-Robust Speech Recognition Using Discrete-Mixture HMMs,Acoustical Science and Technology,29(1) 66-73,2008年01月

    Tetsuo Kosaka, Masaharu Katoh, Masaki Kohda

    共著(国内のみ)

  • 音素モデルを用いた話者ベクトルに基づく話者識別,電子情報通信学会論文誌,J90-D(12) 3201-3209,2007年12月

    小坂哲夫,赤津達也,加藤正治,好田正紀

    共著(国内のみ)

  • Spontaneous Speech Recognition using Discrete-Mixture HMMs,Proc. of ICA2007,CAS-03-034,2007年09月

    Tetsuo Kosaka, Masaharu Katoh and Masaki Kohda

    共著(国内のみ)

  • 発音変形依存モデルを用いた講演音声認識,電子情報通信学会論文誌,J89-D(2) 305-313,2006年02月

    堤怜介,加藤正治,小坂哲夫,好田正紀

    共著(国内のみ)

  • Robust Speech Recognition Using Discrete-Mixture HMMs,IEICE Transactions on Information and Systems,E88-D(12) 2811-2818,2005年12月

    T. Kosaka, M. Katoh and M. Kohda

    共著(国内のみ)

  • Robust Speech Recognition under Non-Stationary Noise Using Discrete-Mixture HMMs,Proc. of NCSP05,347-350,2005年03月

    T.Kosaka, M.Katoh, M.Kohda

    共著(国内のみ)

  • Noisy Speech Recognition with Discrete-Mixture HMMs Based on MAP Estimation,Proc. of ICA2004,(2) 1691-1694,2004年04月

    Tetsuo Kosaka, Masaharu Katoh and Masaki Kohda

    共著(国内のみ)

  • Instantaneous Environment Adaptation Techniques Based on Fast PMC and MAP-CMS Methods,Proc. of ICASSP98,789-792,1998年05月

    T.Kosaka, H.Yamamoto, M.Yamada, Y.Komori

    共著(国内のみ)

  • 最大事後確率推定法と適応データ量に応じた平滑化手法を用いた話者適応,電子情報通信学会論文誌D-II,J81-D-II(3) 465-471,1998年03月

    外村政啓,小坂哲夫,松永昭一

    共著(国内のみ)

  • Fast Parallel Model Combination Noise Adaptation Processing,Proc. of Eurospeech97,1523-1526,1997年09月

    Yasuhiro Komori, Tetsuo Kosaka, Hiroki, Yamamoto, Masayuki Yamada

    共著(国内のみ)

  • Fast Algorithm for Speech Recognition Using Speaker Cluster HMM,Proc. of Eurospeech97,2043-2046,1997年09月

    Masayuki Yamada, Yasuhiro Komori, Tetsuo Kosaka, Hiroki Yamamoto

    共著(国内のみ)

  • Speaker Adaptation for Context-Dependent HMM Using Spatial Relation of Both Phoneme Context Hierarchy and Speakers,Proc. of Eurospeech97,2039-2042,1997年09月

    Yasuhiro Komori, Tetsuo Kosaka, Masayuki Yamada, Hiroki Yamamoto

    共著(国内のみ)

  • Fast Speech Recognition Algorithm Under Noisy Environment Using Modified CMS-PMC and Improved IDMM+SQ,Proc. of ICASSP97,847-850,1997年04月

    H.Yamamoto, T.Kosaka, M.yamada, Y.Komori, M.Fujita

    共著(国内のみ)

  • パラメータのスカラ量子化と混合分布HMMの次元独立演算による高速ゆう度計算,電子情報通信学会論文誌D-II,J79-D-II(12) 2104-2109,1996年12月

    山田雅章,山本寛樹,小坂哲夫,小森康弘,大洞恭則

    共著(国内のみ)

  • Independent Calculation of Power Parameters on PMC Method,Proc. of ICASSP96, pp. 41-44,1996年05月

    H.Yamamoto, M.Yamada, T.Kosaka, Y.Komori, Y.Ohora

    共著(国内のみ)

  • Fast Output Probability Computation Using Scalar Quantization and Independent Dimension Multi-Mixture,Proc. of ICASSP96,893-896,1996年05月

    M.Yamada, H.Yamamoto, T.Kosaka, Y.Komori, Y.Ohora

    共著(国内のみ)

  • Speaker Adaptation Based on Transfer Vector Field Smoothing Using Maximum a Posteriori Probability Estimation,Computer Speech and Language,10(2) 117-132,1996年04月

    Masahiro Tonomura, Tetsuo Kosaka, Shoichi Matsunaga

    共著(国内のみ)

  • 話者クラスタリング手法を用いた不特定話者音素HMM作成法,電子情報通信学会論文誌D-II,J79-D-II(3) 313-321,1996年03月

    小坂 哲夫, 松永 昭一, 倉岡 幹雄

    共著(国内のみ)

  • Speaker-independent speech recognition based on tree-structured speaker clustering,Computer Speech and Language,10(1) 55-74,1996年01月

    Tetsuo Kosaka, Shoichi Matsunaga, Shigeki Sagayama

    共著(国内のみ)

  • Speaking-Style and Speaker Adaptation for the Recognition of Spontaneous Dialogue Speech,Proc. of Eurospeech95,1135-1138,1995年09月

    Shoichi Matsunaga, Tetsuo Kosaka, Tohru Simizu

    共著(国内のみ)

  • Speaker Adaptation Fitting Training Data Size and Contents,Proc. of Eurospeech95,1147-1150,1995年09月

    Masahiro Tonomura, Tetsuo Kosaka, Shoichi Matsunaga, Yumi Wakita, Akito Monden

    共著(国内のみ)

  • Automatic Determination of the Number of Mixture Components for Continuous HMMs Based on a Uniform Variance Criterion,IEICE Tansactions Inf. And Syst.,E78-D(6) 642-647,1995年06月

    Tetsuo Kosaka, Shigeki Sagayama

    共著(国内のみ)

  • Speaker-Independent Phone Modeling Based on Speaker-Dependent HMMs' Composition and Clustering,Proc. of ICASSP95,441-444,1995年04月

    Tetsuo Kosaka, Shoichi Matsunaga, Mikio Kuraoka

    共著(国内のみ)

  • Speaker Adaptation Based on Transfer Vector Field Smoothing Using Maximum a Posteriori Probability Estimation,Proc. of ICASSP95,688-691,1995年04月

    Masahiro Tonomura, Tetsuo Kosaka, Shoichi Matsunaga

    共著(国内のみ)

  • 木構造話者クラスタリングを用いた話者適応,電子情報通信学会論文誌D-II,J78-D-II(1) 1-9,1995年01月

    小坂 哲夫, 松永 昭一, 嵯峨山 茂樹

    共著(国内のみ)

  • Tree-Structured Speaker Clustering for Speaker-Independent Continuous Speech Recognition,Proc. of ICSLP94,1375-1378,1994年09月

    Tetsuo Kosaka, Shoichi Matsunaga, Shigeki Sagayama

    共著(国内のみ)

  • Tree-Structured Speaker Clustering for Fast Speaker Adaptation,Proc. of ICASSP94,245-248,1994年04月

    Tetsuo Kosaka, Shigeki Sagayama

    共著(国内のみ)

  • 話者混合逐次状態分割法による不特定話者音声認識と話者適応,電子情報通信学会論文誌A,J77-A(2) 103-111,1994年02月

    小坂 哲夫, 鷹見 淳一, 嵯峨山 茂樹

    共著(国内のみ)

  • A Dynamic Approach to Speaker Adaptation of Hidden Markov Networks for Speech Recognition,Proc. of Eurospeech93,363-366,1993年09月

    Tetsuo Kosaka, Edward Willems, Jun-Ichi Takami, Shigeki Sagayama

    共著(海外含む)

  • Rapid Speaker Adaptation Using Speaker-Mixtue Allophone Models Applied to Speaker-Independent Speech Recognition,Proc. of ICASSP93,570-573,1993年04月

    Tetsuo Kosaka, Jun-Ichi Takami, Shigeki Sagayama

    共著(国内のみ)

  • An Algorithm for Automatic HMM Structure Generation in Speech Recognition,Proc. of Fourth Australian International Conference on Speech Science and Technology ,104-109,1992年12月

    Tetsuo Kosaka, Shigeki Sagayama

    共著(国内のみ)

  • ATREUS: Continuous Speech Recognition Systems at ATR Interpreting Telephony Research Laboratiories,Proc. of Fourth Australian International Conference on Speech Science and Technology,324-329,1992年12月

    S. Sagayama, M. Sugiyama, K. Ohkura, J. Takami, A. Nagai, H. Singer, H. Hattori, K. Fukuzawa, Y. Kato, K. Yamaguti, T. Kosaka, A. Kurematsu

    共著(国内のみ)

  • 統計的手法およびトップダウン情報を用いた男女声対象の自動ラベリング,電気学会論文誌C,108-C(10) 795-802,1988年01月

    小森 康弘, 小坂 哲夫, 大洞 恭則, 新中 新二

    共著(国内のみ)

全件表示 >>

著書

  • 進化するヒトと機械の音声コミュニケーション,(株)エヌ・ティー・エス,2015年09月

    小坂哲夫 他

  • Acoustics, Speech and Human-Machine Communication (Shuichi ITAHASHI et al. ed.) Chapter 2.3, No. 20.,AOSOSHA Publishing company,2013年12月

    Tetsuo Kosaka et al.

  • E-Activity and Intelligent Web Construction: Effects of Social Design, Chapter16,IGI Global,2011年05月

    Tetsuo Kosaka, Takashi Kusama, Masaharu Kato, Masaki Kohda

  • 電子情報通信学会知識ベース,電子情報通信学会,2011年01月

    原島博編

  • Speech Recognition,I-Tech Education and Publishing,2008年11月

    France Mihelic and Janez Zibert (Ed)

  • Robust Speech Recognition and Understanding,I-Tech Education and Publishing,2007年06月

    M. Grimm and K. Kroschel (Ed)

全件表示 >>

工業所有権

  • 特許,Method and apparatus for detecting words in input speech data,共著

    登録番号( USP5369728 ) ,アメリカ合衆国

  • 特許,Speech synthesis apparatus and method,共著

    登録番号( USP5220629 ) ,アメリカ合衆国

  • 特許,Encoding method for syllables,共著

    登録番号( USP5208863 ) ,アメリカ合衆国

  • 特許,Voice recognizing method and apparatus,共著

    登録番号( USP5621849 ) ,アメリカ合衆国

  • 特許,Speech recognition apparatus and method for matching inputted speech and a word generated from stored referenced phoneme data,共著

    登録番号( USP6236964 ) ,アメリカ合衆国

  • 特許,音声認識システム、情報処理装置及びそれらの制御方法、プログラム,共著

    登録番号( 特許第3581648 ) ,日本国

  • 特許,音声認識装置及びその方法,プログラム,共著

    登録番号( 特許第3542578 ) ,日本国

  • 特許,音声認識方法及び装置,共著

    登録番号( 特許第3397568 ) ,日本国

  • 特許,音声認識方法および装置,共著

    登録番号( 特許第3066920 ) ,日本国

  • 特許,音声認識装置,共著

    登録番号( 特許第2862306号 ) ,日本国

  • 特許,Method and apparatus for processing speech,共著

    登録番号( USP5715363 ) ,アメリカ合衆国

  • 特許,データ処理装置、データ処理方法、記録媒体,櫛田 晃弘,小坂 哲夫,伊藤 史朗

    登録番号( 4565585 ) ,日本国

  • 特許,Method, apparatus and program for recognizing, extracting, and speech synthesizing strings from documents ,Okutani Yasuo, Kosaka Tetsuo

    登録番号( 7318033 ) ,アメリカ合衆国

  • 特許,情報処理装置及びその方法、プログラム,酒井桂一,小坂哲夫

    登録番号( 4047323 ) ,日本国

  • 特許,情報入力方法、情報入力装置及び記憶媒体,小坂哲夫,山本寛樹

    登録番号( 4012228 ) ,日本国

  • 特許,Information processing apparatus and method, and program,Sakai Keiichi, Kosaka Tetsuo

    登録番号( 7165034 ) ,アメリカ合衆国

  • 特許,情報処理装置及びその制御方法、プログラム,廣田誠,小坂哲夫

    登録番号( 3902959 ) ,日本国

  • 特許,情報処理装置及びその方法、プログラム,酒井桂一,小坂哲夫

    登録番号( 3884951 ) ,日本国

  • 特許,音声認識装置及びその方法、プログラム,小坂哲夫,上田隆也

    登録番号( 3880383 ) ,日本国

  • 特許,対話システムおよびその制御方法,小坂哲夫,中川賢一郎,山本寛樹

    登録番号( 3799280 ) ,日本国

  • 特許,情報処理装置及びその制御方法,プログラム,廣田誠,小坂哲夫

    登録番号( 3728251 ) ,日本国

  • 特許,情報入力方法、情報入力装置及び記憶媒体,小坂哲夫、山本寛樹

    公開番号( 特開2006-139789 ) ,日本国

  • 特許,情報処理装置及びその制御方法、プログラム,廣田 誠、小坂哲夫

    公開番号( 特開2005-339513 ) ,日本国

  • 特許,情報処理装置及びその方法、プログラム,酒井桂一、小坂哲夫、

    公開番号( 特開2005-055920 ) ,日本国

  • 特許,情報処理装置、情報処理方法および記録媒体,小坂哲夫、小森康弘、八木沢津義

    公開番号( 特開2004-180197 ) ,日本国

  • 特許,画像形成装置及び画像形成方法,廣田 誠、小坂哲夫、八木沢津義

    公開番号( 特開2004-173210 ) ,日本国

  • 特許,操作代行装置およびその方法、並びに、情報処理装置およびその制御,廣田 誠。小坂哲夫、小森康弘

    公開番号( 特開2004-102918 ) ,日本国

  • 特許,情報提供システム及びその制御方法,小坂哲夫、山田雅章、山本寛樹

    公開番号( 特開2004-072275 ) ,日本国

  • 特許,情報処理装置およびその方法,奥谷泰夫、小坂哲夫

    公開番号( 特開2004-070523 ) ,日本国

  • 特許,サーバ、受信端末,酒井桂一、小坂哲夫

    公開番号( 特開2004-020613 ) ,日本国

  • 特許,Client-server speech processing system, apparatus, method, and storage medium,Ueyama Teruhiko, Komori Yasuhiro, Kosaka Tetsuo, Yamada Masayuki, Kushida Akihiro

    登録番号( USP7058580 ) ,アメリカ合衆国

  • 特許,情報処理装置、情報処理方法及び記憶媒体,小坂哲夫,上田隆也,伊藤史朗,山本寛樹,池田裕治

    登録番号( 特許第3774698 ) ,日本国

  • 特許,マルチモーダル文書受信装置及びマルチモーダル文書送信装置、マルチモーダル文書送受信システム及びそれらの制御方法、プログラム,酒井桂一,小坂哲夫

    登録番号( 特許第3733322 ) ,日本国

  • 特許,情報入力方法、情報入力装置及び記憶媒体,小坂哲夫,山本寛樹

    登録番号( 特許第3762191 ) ,日本国

  • 特許,Image-formingapparatus and image-forming method,共著

    登録番号( USP6877921 ) ,アメリカ合衆国

  • 特許,Client-server speech processing system, apparatus, method, and storage medium ,共著

    登録番号( USP6813606 ) ,アメリカ合衆国

  • 特許,Information Processing Apparatus and Method, a Computer Readable Medium Storing a Control Program for Making a Computer Implemented Information Process, and a Control Program for Selecting a Specific Grammar Corresponding to an Active Input Field of for Controlling Selection of a Grammar or Comprising a Code of a Selection Step of Selecting a Specific Grammar ,共著

    登録番号( USP6587820 ) ,アメリカ合衆国

  • 特許,Method and apparatus for distinguishing speech from noise ,共著

    登録番号( USP6393396 ) ,アメリカ合衆国

  • 特許,Single distribution and mixed distribution model conversion in speech recognition method,共著

    登録番号( USP6266636 ) ,アメリカ合衆国

  • 特許,Speech processing apparatus and method and computer readable medium encoded with a program for recognizing input speech by performing searches based on a normalized current feature parameter,共著

    登録番号( USP6236962 ) ,アメリカ合衆国

  • 特許,Speech recognition method and apparatus using coarse and fine output probabilities utilizing an unspecified speaker model,共著

    登録番号( USP6108628 ) ,アメリカ合衆国

  • 特許,Speech recognition method and apparatus, a computer-readable storage medium, and a computer-readable program for obtaining the mean of the time of speech and non-speech portions of input speech in the cepstrum dimension,共著

    登録番号( USP5924067 ) ,アメリカ合衆国

  • 特許,Speech recognition method and apparatus for recognizing phonemes using a plurality of speech analyzing and recognizing methods for each kind of phoneme,共著

    登録番号( USP5893058 ) ,アメリカ合衆国

  • 特許,Speech recognition method and apparatus for use therein,共著

    登録番号( USP5751898 ) ,アメリカ合衆国

  • 特許,対話システムおよびその制御方法,小坂哲夫、中川賢一郎、山本寛樹

    公開番号( 特開2003-255992 ) ,日本国

  • 特許,音声認識システムおよびその制御方法,小坂哲夫

    公開番号( 特開2003-241796 ) ,日本国

  • 特許,情報処理装置及びその制御方法、プログラム,廣田 誠、小坂哲夫

    公開番号( 特開2003-216424 ) ,日本国

  • 特許,情報処理装置及びその制御方法、プログラム,廣田 誠、小坂哲夫

    公開番号( 特開2003-216293 ) ,日本国

  • 特許,画像検索装置及びその方法、プログラム,中谷 裕、小坂哲夫

    公開番号( 特開2003-196306 ) ,日本国

  • 特許,マルチモーダル入出力装置及びその方法、プログラム,酒井桂一、小坂哲夫

    公開番号( 特開2003-186488 ) ,日本国

  • 特許,音声認識装置及びその方法、プログラム,小坂哲夫、上田隆也

    公開番号( 特開2003-167598 ) ,日本国

  • 特許,マルチモーダル文書受信装置及びマルチモーダル文書送信装置、マルチモーダル文書送受信システム及びそれらの制御方法、プログラム,酒井桂一、小坂哲夫

    公開番号( 特開2003-157167 ) ,日本国

  • 特許,音声認識装置及びその方法、プログラム,小坂哲夫、酒井桂一、山本寛樹

    公開番号( 特開2003-157095 ) ,日本国

  • 特許,プログラム及び情報処理装置,櫛田晃弘、小坂哲夫

    公開番号( 特開2002-304407 ) ,日本国

  • 特許,音声認識システム及び方法及び該システムに用いる情報処理装置とその方法,小坂哲夫、山本寛樹

    公開番号( 特開2002-268681 ) ,日本国

  • 特許,音声認識システム及びその制御方法、コンピュータ可読メモリ,櫛田晃弘、小坂哲夫

    公開番号( 特開2002-162988 ) ,日本国

  • 特許,携帯電話、ユーザインターフェース装置、コンテンツ表示方法、記憶媒体,酒井桂一、小坂哲夫

    公開番号( 特開2002-123288 ) ,日本国

  • 特許,音声処理装置、音声処理方法及び記憶媒体,上田隆也、池田祐治、小坂哲夫、柴山茂樹

    公開番号( 特開2002-116796 ) ,日本国

  • 特許,音声処理システム、装置、方法及び記憶媒体,植山輝彦、小坂哲夫、山田雅章、小森康弘、櫛田晃弘

    公開番号( 特開2001-337695 ) ,日本国

  • 特許,情報入力方法、情報入力装置及び記憶媒体,小坂哲夫、山本寛樹

    公開番号( 特開2001-306293 ) ,日本国

  • 特許,データ処理装置、データ処理方法、記録媒体,櫛田晃弘、小坂哲夫、伊藤史朗

    公開番号( 特開2001-296991 ) ,日本国

  • 特許,音声認識方法、装置及び記憶媒体,中川賢一郎、小坂哲夫、八木沢津義、川崎勝彦、山本寛樹、山田雅章

    公開番号( 特開2001-100786 ) ,日本国

  • 特許,情報処理方法、装置及び記憶媒体,中川賢一郎、小坂哲夫、八木沢津義

    公開番号( 特開2001-014331 ) ,日本国

  • 特許,音声認識装置及び方法,小坂哲夫

    公開番号( 特開2000-284792 ) ,日本国

  • 特許,撮像装置、撮像方法、撮像装置制御システム及び記憶媒体,小坂哲夫, 高木常好

    公開番号( 特開2000-101901 ) ,日本国

  • 特許,カメラ制御装置及びコンピュータ読み取り可能な記憶媒体,坂内祐一, 大矢崇, 小坂哲夫

    公開番号( 特開2000-092368 ) ,日本国

  • 特許,情報処理方法及び装置、その記憶媒体,中川賢一郎, 小坂哲夫, 小森 康弘

    公開番号( 特開2000-047696 ) ,日本国

  • 特許,音声認識装置および方法,小坂哲夫

    公開番号( 特開2000-047686 ) ,日本国

  • 特許,音声認識装置及び方法及びその記憶媒体,小坂哲夫

    公開番号( 特開平11-202893 ) ,日本国

  • 特許,音声応答装置及びその方法、コンピュータ可読メモリ,小坂哲夫

    公開番号( 特開平11-161293 ) ,日本国

  • 特許,音声応答装置及びその方法、コンピュータ可読メモリ,中川賢一郎, 小坂哲夫

    公開番号( 特開平11-153998 ) ,日本国

  • 特許,音声認識方法及び装置並びに記憶媒体,小森康弘, 小坂哲夫

    公開番号( 特開平10-097277 ) ,日本国

  • 特許,音声認識方法及びその装置,小坂哲夫

    公開番号( 特開平05-197397 ) ,日本国

  • 特許,音声認識方法及び装置,小坂哲夫

    公開番号( 特開平05-094198 ) ,日本国

  • 特許,音声出力装置,小坂哲夫, 松尾広, 田村純一

    公開番号( 特開平05-040600 ) ,日本国

  • 特許,表示制御方法及びその装置,松尾広, 田村純一, 小坂哲夫

    公開番号( 特開平04-331982 ) ,日本国

  • 特許,着信報知装置,松尾広, 桜井穆, 田村純一, 小坂哲夫

    公開番号( 特開平04-129453 ) ,日本国

  • 特許,ポケツトベル,松尾広, 桜井穆, 田村純一, 小坂哲夫

    公開番号( 特開平04-129433 ) ,日本国

  • 特許,音声合成方法及び装置,小坂哲夫, 桜井穆, 田村純一

    公開番号( 特開平03-149600 ) ,日本国

  • 特許,音声認識装置,小坂哲夫, 大洞恭則, 小森康弘, 新中新二

    公開番号( 特開平01-262597 ) ,日本国

  • 特許,音声合成装置,小坂哲夫

    公開番号( 特開平01-189700 ) ,日本国

  • 特許,音声認識装置,小坂哲夫

    公開番号( 特開平01-040898 ) ,日本国

  • 特許,Information processing apparatus and method, a computer readable medium storing a control program for making a computer implemented information process, and a control program for selecting a specific grammar corresponding to an active input field or for controlling selection of a grammar or comprising a code of a selection step of selecting a specific grammar,Kosaka Tetsuo, Ueda Takaya, Ito Fumiaki, Yamamoto Hiroki, Ikeda Yuji

    登録番号( USP7024361 ) ,アメリカ合衆国

  • 特許,Speech recognition system, speech recognition server, speech recognition client, their control method, and computer readable memory ,Kushida Akihiro, Kosaka Tetsuo

    登録番号( USP7099824 ) ,アメリカ合衆国

  • 特許,音声変換装置、及びプログラム,鈴木隆司, 小坂哲夫

    登録番号( 特許第6038918号 ) ,日本国

全件表示 >>

学術関係受賞

  • 令和4年度山形大学研究推進報奨,2023年04月27日,日本国,山形大学,小坂哲夫

  • 令和元年度山形大学研究推進報奨,2020年02月26日,日本国,山形大学,小坂哲夫

  • IEEE GCCE2017 Outstanding Demo Award,2017年10月26日,アメリカ合衆国,The Institute of Electrical and Electronics Engineers, Inc,Takeru Koseki, Tetsuo Kosaka

  • 電子情報通信学会 情報・システムソサイエティ査読功労賞,2017年06月,日本国,電子情報通信学会,小坂哲夫

  • 平成28年度山形大学研究推進報奨,2017年03月29日,日本国,山形大学,小坂哲夫

  • 平成25年度山形大学研究推進報奨,2014年03月28日,日本国,山形大学,小坂哲夫

  • 平成7年度電子情報通信学会論文賞,1996年05月,日本国,電子情報通信学会,小坂哲夫,松永昭一,嵯峨山茂樹

  • ATR論文賞,1994年,日本国,ATR,小坂哲夫,鷹見淳一,嵯峨山茂樹

全件表示 >>

科研費(文科省・学振)獲得実績

  • 基盤研究(C),2022年04月 ~ 2025年03月,多様な音声への応用を目指した転移学習による感情認識システムの開発

    知覚情報処理関連

  • 基盤研究(C),2019年04月 ~ 2022年03月,高精度な感情音声認識技術を用いた音声からの感情推定の研究

    知覚情報処理関連

  • 基盤研究(C),2016年04月 ~ 2019年03月,ディープラーニングに基づく音声認識の音響モデル適応の研究

  • 基盤研究(C),2013年04月 ~ 2016年03月,大規模コーパスを利用した音声・音響信号の自動分類と音声認識への応用

    音声コーパスの拡大および計算機の性能向上による演算スピートの増加により,高精度な音声認識が可能となりつつある.しかし音声や音響信号には多様性があり,常に良好に認識できるわけではない.話者による性能劣化,雑音や残響などの影響など,多くの問題点が残されている.本研究ではクラスタリング技術を用い,音声・音響信号の多様性による音声認識の性能劣化の問題に取り組む.信号の特徴を利用して自動分類により性質の類似した信号をクラス別にまとめ,クラスごとモデルを構築し認識に利用する.

  • 基盤研究(C),2010年04月 ~ 2013年03月,高精度な話し言葉認識技術の開発

    講演や会議音声など,話し言葉音声の認識の高精度化を目指す.この目的に対し,1)音響・言語モデルの高精度化,2)話者インデキシング,3)システム統合の3点の課題について重点的に取り組む.

  • 基盤研究(C),2004年04月 ~ 2007年03月,雑音に頑健な音声認識手法の開発とモバイル環境への応用

    音声認識の主要な応用のひとつとして,モバイル環境での利用が考えられる.モバイル環境では屋外などで使用される場合が多く,これを実現するためには雑音の問題を解決する必要がる.本研究ではこの雑音の問題に対して,主に,音響モデルによる解決を目指す.この解決のために,従来あまり使用されていない離散分布HMMを用いる.離散分布HMMは,モデルの出力分布の表現において,正規分布の仮定が必要なく,任意の分布形状が表現できるという利点があるが,これまでの検討ではパラメータ推定の問題により,あまり使われることはなく,現状では音声認識システムの大部分は連続分布HMM(CHMM)を使用している.しかし本研究では,MAP推定,尤度補償法などの改良を加えることにより,雑音下では離散分布HMMをベースとした手法が,一般的なCHMMより高い性能が得られることを示した.

全件表示 >>

研究発表

  • 情報処理学会全国大会,国内会議,2024年03月,神奈川大学横浜キャンパス,歌声音源を用いた深層学習による自動採譜の検討,口頭発表(一般)

  • 情報処理学会全国大会,国内会議,2024年03月,神奈川大学横浜キャンパス,End-to-Endモデルに基づく混合感情の音声合成に関する検討,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2024年02月,オンライン,Any-to-one声質変換における音素事後確率特徴量の検討,口頭発表(一般)

  • 音声言語情報処理研究会,国内会議,2023年12月,機械振興会館,話し言葉を考慮した音響および言語特徴併用による音声感情認識,口頭発表(一般)

  • 日本音響学会秋季講演論文集,国内会議,2023年09月,名古屋工業大学,話し言葉を考慮した言語特徴による音声感情認識,ポスター発表

  • ヒューマンコミュニケーション基礎研究会,国内会議,2023年08月,関西学院大/オンライン,ユーザの表情の感情情報を用いた音声対話システム,口頭発表(一般)

  • 日本音響学会春季講演論文集,国内会議,2023年03月,オンライン,深層学習モデルを用いた言語特徴と音響特徴の後期融合による音声感情認識,口頭発表(一般)

  • 日本音響学会春季講演論文集,国内会議,2023年03月,オンライン,ボーカル音源を考慮した楽曲のコード認識の検討,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2023年02月,オンライン,視線情報を用いたマルチモーダル対話システム,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2023年02月,オンライン,音素事後確率を用いた声質変換におけるボコーダの検討,口頭発表(一般)

  • 東北地区音響学研究会,国内会議,2022年11月,言語特徴と音響特徴の後期融合による音声感情認識の検討,口頭発表(一般)

  • 東北地区音響学研究会,国内会議,2022年11月,ボーカル音源を対象とした楽曲のコード認識の検討,口頭発表(一般)

  • 応用物理学会東北支部学術講演会,国内会議,2021年12月,オンライン,サブビンを用いたスペクトル測定システムの基礎検討,口頭発表(一般)

  • 電気学会研究会,国内会議,2021年09月,オンライン,サブビンを用いた周波数スペクトルにおけるSL低減の基礎検討,口頭発表(一般)

  • 日本音響学会音声研究会,国内会議,2021年09月,オンライン,音声認識結果に基づく言語特徴と音響特徴による音声感情認識,口頭発表(一般)

  • 日本音響学会秋季講演論文集,国内会議,2021年09月,オンライン,敵対的生成ネットワークを用いた非並列歌声変換の検討,ポスター発表

  • 応用物理学会春季学術発表会,国内会議,2021年03月,オンライン,周波数サブビンによるスペクトル高分解能化の基礎検討,口頭発表(一般)

  • 電気学会光・量子デバイス研究会,国内会議,2021年03月,オンライン,サブビン周波数構造を用いたスペクトル高分解能化の基礎検討,口頭発表(一般)

  • 日本音響学会春季講演論文集,国内会議,2021年03月,オンライン,敵対的生成ネットワークを用いた歌声変換の各種検討,ポスター発表

  • 情報処理学会東北支部研究会,国内会議,2021年03月,オンライン,歌声音声合成におけるブレス挿入の検討,口頭発表(一般)

  • 東北地区音響学研究会,国内会議,2020年11月,ユーザの非言語情報を併用したマルチモーダル対話システムの開発とその評価,口頭発表(一般)

  • 東北地区音響学研究会,国内会議,2020年11月,敵対的生成ネットワークを用いた歌声変換の基礎検討,口頭発表(一般)

  • 東北地区音響学研究会,国内会議,2020年11月,感情音声認識を対象とした言語モデル適応の評価,口頭発表(一般)

  • 日本音響学会秋季講演論文集,国内会議,2020年09月,音声の時系列特徴量と統計量の融合による感情認識,口頭発表(一般)

  • 日本音響学会春季講演論文集,国内会議,2020年03月,埼玉大学,ツイート情報を利用した言語モデルによる感情音声認識,ポスター発表

  • 情報処理学会東北支部研究会,国内会議,2020年03月,山形大学工学部,音声による感情認識における時系列特徴量と統計量の融合方法の検討,口頭発表(一般)

  • 第2回東北支部音響学研究会,国内会議,2019年11月,福島大学,マルチモーダル対話システムにおける音声認識性能の影響に関する検討,口頭発表(一般)

  • 第2回東北支部音響学研究会,国内会議,2019年11月,福島大学,ディープニューラルネットワークを用いたコード認識の性能向上の検討,口頭発表(一般)

  • 日本音響学会秋季講演論文集,国内会議,2019年09月,音響・言語モデルの同時適応による感情音声認識の精度改善,ポスター発表

  • 日本音響学会秋季講演論文集,国内会議,2019年09月,感情音声データベースJTESを用いた音声感情認識における特徴量の検討,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2019年03月,山形大学工学部,言語モデルの改良による感情音声の認識と韻律制御声質変換の性能向上,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2019年03月,山形大学工学部,日本語感情音声コーパスJTESを対象とした感情認識の基礎検討,口頭発表(一般)

  • 日本音響学会春季講演論文集,国内会議,2019年03月,遠隔音声認識と身体動作認識を併用したマルチモーダル対話システムの構築,ポスター発表

  • 日本音響学会秋季講演論文集,国内会議,2018年09月,感情音声認識における音響モデル適応と声質変換への応用,ポスター発表

  • 情報処理学会インタラクション2018,国内会議,2018年03月,ユーザの身体動作から興味を推定するマルチモーダル対話システム,ポスター発表

  • 情報処理学会東北支部研究会,国内会議,2018年03月,自発対話音声を用いた感情認識の学習データによる検討,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2018年03月,DNNを用いた教師なしクロス適応の性能評価,口頭発表(一般)

  • 情報処理学会研究報告,国内会議,2017年12月,感情音声データベースJTESを用いた感情音声認識におけるモデル適応の性能向上の検討,ポスター発表

  • 日本音響学会秋季講演論文集,国内会議,2017年09月,DNNを用いた映画の音声区間検出におけるクラス分類の検討,ポスター発表

  • 日本音響学会秋季講演論文集,国内会議,2017年09月,感情音声データベースJTESを用いた感情音声認識におけるDNN-HMM音響モデル適応の検討,ポスター発表

  • 人工知能学会全国大会,国内会議,2017年05月,映画からのマルチモーダル対話コーパスの作成,口頭発表(一般)

  • 情報処理学会全国大会,国内会議,2017年03月,英語音声における連音の自動検出の検討,ポスター発表

  • 情報処理学会東北支部研究会,国内会議,2017年03月,DNNによる音声認識を用いた感情音声の声質変換の検討,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2017年03月,SVMを用いた自発対話音声の感情認識における学習データの検討,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2017年03月,音素構造音響モデルを用いた非並列学習による声質変換,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2016年09月,高精度な初期モデルを用いた教師なしクロス適応の評価,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2016年09月,HMM認識・合成による感情音声の声質変換の性能向上,口頭発表(一般)

  • 電子情報通信学会総合大会,国内会議,2016年03月,音素の音響的特徴を利用した水中音声の声質変換,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2016年03月,DNNを用いた日本語音声の感情認識の検討,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2016年03月,音声対話システムにおける擬人化エージェントの感情表出に関する検討,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2016年03月,話者適応による音響モデルを用いた韻律制御音声合成の検討,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2016年03月,ディープニューラルネットワークを用いた映画中の音声区間検出の検討,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2015年09月,ディープニューラルネットによる話者クラス音響モデルを用いた音声認識,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2015年09月,HMM認識・合成による感情音声の声質変換,口頭発表(一般)

  • 電子情報通信学会総合大会,国内会議,2015年03月,感情音声を用いた韻律制御音声合成システムの検討,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2015年03月,DNN-HMMを用いた音声認識におけるパラメータ数の検討,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2015年03月,最尤推定による話者クラスDNNの出力統合を用いた音声認識,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2015年03月,DNN-HMMを用いた教師なしクロス適応の性能改善の検討,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2015年03月,schwaを考慮した英語発音評定システムの精度向上,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2014年09月,Deep Learningによる教師つき適応の結果を用いた日本語講演音声認識の誤り解析,口頭発表(一般)

  • 電気関係学会東北支部連合大会,国内会議,2014年08月,音声認識におけるDNNを用いた話者クラスモデルの検討,口頭発表(一般)

  • 電気関係学会東北支部連合大会,国内会議,2014年08月,韻律制御音声合成システムの精度向上の評価と検討,口頭発表(一般)

  • 情報処理学会研究会,国内会議,2014年05月,DNN-HMMを用いた音響モデルおよび言語モデルのクロス適応,口頭発表(一般)

  • パーソナルコンピュータ利用技術学会研究会,国内会議,2014年03月,算数や数学における不正解理由別教授法,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2014年03月,HMMを用いた水中発話に対する自動ラベル付けの精度向上,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2014年03月,統計的手法による水中音声の声質変換における精度向上の検討,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2014年03月,スペクトル抽出法の違いによる合成音声品質の比較,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2014年03月,雑音重複区間のモデル化による音声区間検出の性能向上,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2014年03月,DNN-HMMを用いた日本語講演音声認識における話者適応の検討,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2013年09月,単語グラフを用いた音声アライメント,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2013年09月,大規模話者クラス音響モデルを用いた音声認識の精度向上の検討,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2013年03月,クロスバリデーションによる教師なし言語適応における各種パラメータの最適化,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2013年03月,入力音声の韻律情報を用いたHMM音声合成,口頭発表(一般)

  • 情報処理学会研究会,国内会議,2012年12月,話者クラス音響モデルを用いた講演音声認識におけるクラスタリング手法の各種検討,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2012年09月,日本人英語の自動発音評定における誤り規則の検討,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2012年09月,雑音下音声認識におけるフレーム重みづけヒストグラム同等化法の検討,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2012年03月,雑音下音声認識におけるヒストグラム同等化法の改良,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2012年03月,単語グラフ統合を用いた残響下音声認識の検討,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2012年03月,自動発音評定における母音置換規則の検討,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2012年03月,教師なし話者適応における各種パラメータの最適化,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2011年09月,少量のデータによるヒストグラム同等化法の検討,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2011年03月,教師なし音響・言語モデル適応の性能改善,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2011年03月,頭部運動が3次元空間の音像定位した音声了解度に及ぼす影響,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2011年03月,日本人英語の自動発音評定における精度向上の検討,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2010年09月,Quinphone HM-Netに基づく講演音声認識,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2010年09月,日本人英語と米国人英語の音素モデル間距離の検討,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2010年09月,頭部運動が音声了解度へ及ぼす影響,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2010年03月,話者クラス音響モデル及び単語グラフ統合を用いた教師なし適応の改善,口頭発表(一般)

  • 電子情報通信学会総合大会,国内会議,2010年03月,話者ベクトルを用いた話者インデキシングの性能向上の検討,口頭発表(一般)

  • 電子情報通信学会総合大会,国内会議,2010年03月,話者クラスモデルを用いた音声雑音下における音声区間検出,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2010年03月,出力統合を用いた雑音環境下の音声認識の検討,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2010年03月,音素クラスHMMを用いた話者ベクトルに基づく話者照合の検討,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2010年03月,単語グラフ統合を用いた講義音声認識の検討,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2010年03月,識別学習を用いた離散混合分布HMMによる講演音声認識の検討,口頭発表(一般)

  • 情報処理学会研究会,国内会議,2009年12月,英語発音評定における各種正規化の検討,口頭発表(一般)

  • 電気学会研究会,国内会議,2009年07月,音声雑音環境下における音声区間検出の検討,口頭発表(一般)

  • 電子情報通信学会研究会,国内会議,2009年07月,話者クラス音響モデルを用いた講演音声認識の性能向上,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2009年03月, webテキストを利用した言語モデルの検討,口頭発表(一般)

  • 日本音響学会春季研究発表会,国内会議,2009年03月,ヒストグラム同等化を用いた英語発音自動評定の性能改善,ポスター発表

  • 日本音響学会春季研究発表会,国内会議,2009年03月,話者クラス音響モデルを用いた講演音声認識における教師なし適応の改善,ポスター発表

  • 情報処理学会東北支部研究会,国内会議,2009年03月,話者ベクトルを用いた話者インデキシングにおけるアンカーモデルの検討,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2009年03月,話し言葉音声認識における話者適応の性能改善,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2009年03月, 離散混合分布HMMの識別学習の検討,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2009年03月, 識別学習を用いた大語彙連続音声認識の検討,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2009年03月,システム統合による大語彙連続音声認識の性能改善の検討,口頭発表(一般)

  • 電子情報通信学会音声研究会,国内会議,2008年12月,PLSA言語モデル適応におけるアニーリングスケジュールの評価,口頭発表(一般)

  • 日本音響学会秋季研究発表会,国内会議,2008年09月, ヒストグラム同等化を用いた英語発音自動評定の検討,ポスター発表

  • 日本音響学会秋季研究発表会,国内会議,2008年09月, 離散分布HMMと連続分布HMMの出力統合による雑音下音声認識の検討,ポスター発表

  • 日本音響学会秋季研究発表会,国内会議,2008年09月,Unigram Rescaling を用いたBack-off N-gramの高速適応,口頭発表(一般)

  • 日本音響学会秋季研究発表会,国内会議,2008年09月,PLSA 言語モデルの並列化による高速学習,口頭発表(一般)

  • 電子情報通信学会音声研究会,国内会議,2008年07月, 話者ベクトルに基づく音声照合法の検討,口頭発表(一般)

  • 電子情報通信学会音声研究会,国内会議,2008年07月,話者クラス音響モデルおよび話者適応を用いた話し言葉音声認識の検討,口頭発表(一般)

  • 情報処理学会東北支部大会,国内会議,2008年03月,マルチコンディションモデルを用いた音楽環境下の音声認識の検討,口頭発表(一般)

  • 日本音響学会春季研究発表会,国内会議,2008年03月,日本語話し言葉コーパスにおける話者クラス音響モデルの効果,ポスター発表

  • 情報処理学会東北支部大会,国内会議,2008年03月,PLSAに基づくクラスN-gram言語モデルの適応,口頭発表(一般)

  • 情報処理学会東北支部大会,国内会議,2008年03月,話し言葉音声認識のPLSA言語モデル適応,口頭発表(一般)

  • 情報処理学会東北支部大会,国内会議,2008年03月,quinphone音響モデルの検討,口頭発表(一般)

  • 情報処理学会東北支部大会,国内会議,2008年03月,全共分散音響モデルの性能評価,口頭発表(一般)

  • 情報処理学会東北支部大会,国内会議,2008年03月,ヒストグラム同等化を用いた話者適応の検討,口頭発表(一般)

  • 情報処理学会東北支部大会,国内会議,2008年03月,話者ベクトルを用いた話者照合の検討,口頭発表(一般)

  • 音声言語情報処理研究会,国内会議,2007年12月, 音素クラスHMMを使用した話者ベクトルに基づく話者識別法の検討,口頭発表(一般)

  • 日本音響学会秋期講演発表会,国内会議,2007年09月,山梨県甲府市,繰り返し教師なし適応による講演音声認識,口頭発表(一般)

  • 第348回音響工学研究会,国内会議,2007年07月,識別学習による講演音声認識の性能改善,口頭発表(一般)

  • 電子情報通信学会研究会,国内会議,2007年06月,話者ベクトルによる雑音下話者識別の検討,口頭発表(一般)

  • 電子情報通信学会研究会,国内会議,2007年06月,講演音声認識における教師なし適応の改善,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2007年03月,音素構造距離を用いた英語発音自動評定の精度向上の検討,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2007年03月,話者ベクトルを用いた話者識別法における次元圧縮の効果,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2007年03月,日本語話し言葉コーパスを用いた重要文抽出,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2007年03月,参議院の議事録を用いた言語モデルの作成,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2007年03月,会議音声の話者インデキシングと話者適応,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2007年03月,話し言葉音声認識における教師なし適応の改善,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2007年03月,日本語話し言葉コーパスを用いた離散混合分布HMMの性能評価,口頭発表(一般)

  • 電子情報通信学会研究会,国内会議,2006年12月,音素モデルを用いた話者ベクトルに基づく話者識別の検討,口頭発表(一般)

  • ASA/ASJ Forth Joint Meeting,国際会議,2006年11月 ~ 2006年12月,Honolulu, Hawaii,Noisy speech recognition based on codebook normalization of discrete-mixture HMMs. ,ポスター発表

  • 日本音響学会講演会,国内会議,2006年09月,コードブック適応を用いた離散混合分布型HMMによる講演音声認識 ,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2006年09月,参議院会議音声の言語モデル適応,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2006年09月,話者ベクトルを用いた話者識別法における音響モデルの検討,口頭発表(一般)

  • 音声言語情報処理研究会,国内会議,2006年07月,コードブック適応を用いた離散混合分布型HMMによる講演音声認識,口頭発表(一般)

  • 電子情報通信学会研究会,国内会議,2006年06月,離散混合分布HMMのヒストグラム同等化を用いたコードブック正規化,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2006年03月,書き起こしと講演録を用いた言語モデルの作成法の検討,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2006年03月,日本語話し言葉コーパスを用いた音声要約の検討,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2006年03月,書き起こしと講演録用いた言語モデルの作成法の検討,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2006年03月,教師なし適応による講演音声認識の性能改善,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2006年03月,話者ベクトルを用いた雑音下話者認識手法の検討,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2006年03月,ヒストグラム同等化を用いた離散混合分布HMMのコードブック適応,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2006年03月,離散混合分布HMMのコードブック正規化による雑音下音声認識,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2006年03月,日本語話し言葉コーパスを用いた教師なし適応による講演音声認識の性能,口頭発表(一般)

  • 電子情報通信学会研究会,国内会議,2005年12月,日本語話し言葉コーパスを用いた発音変形依存モデルによる講演音声認識の性能評価,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2005年09月,日本語話し言葉コーパスを用いた発音変形依存モデルによる講演音声認識の性能評価,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2005年09月,日本語話し言葉コーパスによる離散混合分布型HMMの評価,口頭発表(一般)

  • 電子情報通信学会研究会,国内会議,2005年06月,離散混合分布型HMMによる講演音声認識の検討,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2005年03月,日本語話し言葉コーパスの形態素解析,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2005年03月,離散混合出力分布型HMMによる雑音下音声認識のMFCCでの評価,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2005年03月,分散音声認識システムにおける話者ベクトルを用いた話者識別の検討,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2005年03月,日本語話し言葉コーパスを用いた講演音声認識の性能評価,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2004年10月,参議院会議の音声認識,口頭発表(一般)

  • 電子情報通信学会研究会,国内会議,2004年05月,ETSI標準フロントエンドを用いた雑音下音声認識の検討,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2004年03月,ETSI標準フロントエンドを用いた雑音重畳音声認識の検討,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2004年03月,相互情報量と出現頻度を併用した文字列N-gram,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2004年03月,発音変形依存と教師なし適応による講演音声認識の性能改善,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2004年03月,分散音声認識のクライアントにおけるマイク特性変動の除去,口頭発表(一般)

  • 第3回話し言葉の科学と工学ワークショップ講演会,国内会議,2004年02月,発音変形依存と教師なし適応による講演音声認識の性能改善,口頭発表(一般)

  • 電子情報通信学会研究会,国内会議,2003年12月,離散混合出力分布型HMMを用いた非定常雑音下の音声認識,口頭発表(一般)

  • 第326回音響工学研究会,国内会議,2003年10月,かな・漢字文字列を単位とした言語モデルの検討,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2003年09月,ETSI標準フロントエンドを用いたマルチコンディション学習による雑音重畳音声認識の検討,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2003年09月,MAP推定による離散混合出力分布型HMMを用いた非定常雑音下における音声認識の検討,口頭発表(一般)

  • 電子情報通信学会研究会,国内会議,2003年05月,MAP推定を用いた離散混合出力分布型HMMの雑音重畳音声での評価,口頭発表(一般)

  • 電子情報通信学会研究会,国内会議,2003年05月,講演音声認識における音響・言語モデルの話者適応の研究,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2003年03月,マルチコンディション学習による雑音重畳音声認識,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2003年03月,講演音声認識における話者適応の検討,口頭発表(一般)

  • 日本音響学会講演会,国内会議,2003年03月,離散混合出力分布型HMMのMAP推定による雑音適応の検討,口頭発表(一般)

  • 情報処理学会東北支部研究会,国内会議,2003年03月,講演音声認識における音響モデルの話者適応,口頭発表(一般)

  • 情報処理学会研究会,国内会議,2002年12月,講演音声認識のための音響・言語モデルの検討,口頭発表(一般)

  • 情報処理学会研究会,国内会議,2002年12月,かな・漢字文字列を単位とした言語モデルの検討,口頭発表(一般)

全件表示 >>

共同研究希望テーマ

  • 音声情報処理の応用に関する研究,産学連携、民間を含む他機関等との共同研究等を希望する,受託研究,共同研究

 

担当授業科目

全件表示 >>

 

学会・委員会等活動

  • 日本音響学会,編集委員会委員,2007年06月 ~ 2013年05月

  • 電子情報通信学会,論文査読委員,1995年01月 ~ 継続中

  • 日本音響学会,論文査読委員,1997年01月 ~ 継続中

  • W3C Voice Browser Working Group,Member,1999年03月 ~ 2002年08月

  • 情報処理学会,音声言語情報処理研究運営委員会 委員,2009年04月 ~ 2011年03月

  • 電子情報通信学会,東北支部役員,2011年 ~ 2012年

  • 情報処理学会,東北支部役員,2015年04月 ~ 2019年03月

  • 日本音響学会,東北支部役員,2019年04月 ~ 2023年03月

  • 日本音響学会,東北支部 顧問,2023年04月 ~ 継続中

全件表示 >>

社会貢献活動

  • サイエンスパートナープログラム講師,2009年05月 ~ 2009年10月

相談に応じられる分野

  • 音声認識などの音声情報処理

  • 機械学習の応用