검색 상세

핵심어 검출 시스템의 성능향상을 위한 새로운 신뢰도에 관한 연구

A study on a new confidence measure for the performance enhancement of keyword spotting system

초록/요약

기존의 신뢰도에서 음소단위로 신뢰도를 계산하는데, 이는 음소레이블링 올바르게 되었다고 가정하였을 때는 타당하다. 그러나 오인식의 경우 음소레이블링이 부정확하기 때문에, 이 음소레이블링의 일치성은 항상 만족되는 것이 아니다. 본 논문에서는 음소레이블링의 불일치성의 가정하게 반필러 기반의 신뢰도를 제안한다. 그리고 기존에 제안되었던 정규화 신뢰도와의 통합방법으로서 하이브리드 신뢰도를 고안한다. 정규화신뢰도는 RLJ-CM의 통계적 불일치성의 가정하에 변형한 것이다. 제안한 신뢰도를 검증하기 위하여, 핵심어검출 시스템에서 오검출된 단어를 거절하는 문제에 제안된 신뢰도들을 적용하였다. 사용된 핵심어 검출시스템은 대학명의 디렉토리 서비스를 위하여 개발된 것이다. 실험결과에 의하면, 하이브리드 신뢰도가 RLJ-CM, 정규화 신뢰도를 사용할 때, 기존의 신뢰도에 비하여 약 40%정도 오검출율을 줄일 수 있었다. 그러나 반필러신뢰도와 하이브리드 신뢰도는 오직 영역제안 핵심어 검출 시스템에만 적용이 가능하다. 이는 필러 모델의 음소열이, 적은 수의 가비지 단어를 사용하는 경우에만, 정확하게 탐색될 수 있기 때문이다. 그러므로 영역제안 핵심어검출 시스템은 많은 응용분야에 적용이 가능하기 때문에 본 논문에서 제안된 신뢰도는 충분히 가치가 있다고 판단된다. 향후, 단어레벨 신뢰도의 불일치성과 레이블링 불일치성에 더욱 강인한 신뢰도를 개발할 것이며, 단어에 종속적인 가변 임계치를 사용하는 방법을 고려중에 있다.

more

초록/요약

In this paper, we propose the anti-filler based confidence measure(AFCM) under the famt that the assumption of labeling consistence in the conventional confidence calculation may not be correct. And we devise the hybrid confidence measure(HCM), which is the merging technique of AFCM and normalized confidence measure(NCM) developed by Kim, Cheol. NCM is the modified confidence measure of RLJ-CM under the assumption of statistical inconsistency. To evaluate our proposed confidence measures we applied them to the rejection problem of unwanted false alarmed words the keyword spotting system. The keyword spotting system was developed for directory service of university names. According to our experimental results HCM showed superior performance to the proposed NCM and AFCM as well as to the conventional RLJ-CM. HCM achieved 40% of false alarm reduction compared with the conventional confidence measure. However, AFCM and HCM can be applied only to domain specific keyword spotting systim. This is because phoneme sequence of filler model can be searched correctly just in case of being with small number of garbage words. Thus AFCM and HCM is a kind of domain-specific confidence measure. However, since there are many applications of domain-specific keyword spotting systems, our proposed confidence measures are fairly valuable and important. In the future, we will divelop more robust confidence measure considering the word-level CM's inconsistency and labeling inconsistency. We are under developing a variable threshold method without CM statistics of word CMs, which is word dependent.

more

목차

목차
그림목차 = iii
표목차 = iv
영문요약 = v
제1장 서론 = 1
제2장 핵심어 검출시스템 = 5
2.1. 핵심어 검출시스템의 구성 = 6
2.2. 음소 HMM을 이용한 핵심어 검출시스템 = 7
2.3. 음성분석 및 특징파라메터 추출 = 11
2.4. 핵심어 검출과정 = 17
2.5. 후처리과정 = 19
제3장 기존의 신뢰도 방식과 문제점 = 21
3.1. 기존의 단어신뢰도 = 22
3.2. 기존의 단어단위 신뢰도의 문제점= 28
제4장 제안된 반 필러 신뢰도와 하이브리드신뢰도 = 31
4.1. 반 필러신뢰도 = 31
4.2. 하이브리드신뢰도 = 33
제5장 실험 및 고찰 = 35
5.1. 실험에 사용된 데이터베이스 = 35
5.2. 기존의 신뢰도를 이용한 실험결과 = 37
5.3. 기존의 정규화된 신뢰도를 이용한 실험결과 = 40
5.4. 반 필러신뢰도를 이용한 실험결과 = 42
5.5. 하이브리드신뢰도를 이용한 실험결과 = 45
제6장 결론 = 47
초록 = 49
참고문헌 = 49
감사의 글 = 52

more