기술이전
문의하기
도입희망기술
신청하기

BLSTM 기반 스펙트럼 감산 온라인 빔포밍 시스템

BLSTM(Bidirectional Long Short-Term Memory) 기반 마스크 추정 값을 활용하여 시간에 따라 변화하는 입력에 적응하는 빔포밍 벡터를 출력하고, 음성이 입력으로 들어오는 시점에서 빠르게 수렴하는 빔포밍 벡터 추정을 위한 시스템을 제안하는데 그 목적이 있음.

특허 출원/등록 번호

  • 출원번호 : 10-2021-0159916
  • 등록번호 : 10-2496767

대표도

10-2496767.PNG

기술 동향

  • 최근 자연어 음성인식은 딥러닝 모델의 최적화, 비지도 학습방식 개발, 멀티모달(Multi-Modal) 융합으로 기술적 성능 개선이 급격히 이루어지고 있음.
    음성인식 AI는 주로 인공지능 스피커를 통해 대중화되고 있음. 뉘앙스와 세렌스는 의료분야, 자동차 분야에 각각 특화한 엔진으로 세계 시장을 주도하고 있으며, 국내 기업들은 한국어 위주 콜센터 녹취, 회의록 전사, 외국어 교육 등의 시장을 확대하고 있음.

특장점

  • 스펙트럼 감산 온라인 빔포밍 시스템에 관한 것으로서, 관측 신호를 입력으로 하여, 음성 강화에 사용되는 음성 강화 빔포밍 벡터와 잡음 추정에 사용되는 잡음 강화 빔포밍 벡터를 추정하기 위한 빔포밍 벡터  추정기 및 상기 잡음 강화 빔포밍 벡터의스펙트럼을 감산하기 위한 스펙트럼   감산부를 포함함.
    BLSTM 마스크 추정 값을 이용한 온라인 빔포밍 업데이트 알고리즘을 제안함으로써, 시시각각  변하는 음성, 잡음 및 발화자의 위치를 반영하여 적응된 빔포밍 벡터를 출력할 수 있는 효과가 있음.

기술의 완성도

  • TRL1
  • TRL2
  • TRL3
  • TRL4
    실험실 규모의 소재/부품/시스템 핵심성능 평가
  • TRL5
  • TRL6
  • TRL7
  • TRL8
  • TRL9

가능한 사업화 형태

  • 기술이전 또는 실시권 설정
키워드
담당자
  • 기술사업화팀
  • 043-261-3873