미국 컬럼비아대 연구팀이 '이모(Emo)'라는 로봇 얼굴을 개발했다. 이모는 26개의 정밀 제어 모터를 사용하여 모음, 자음, 그리고 노래를 발성할 수 있다. 이모는 발음 규칙을 입력받지 않고 학습을 통해 입 모양을 익힌다. 이모는 거울 앞에서 자신의 얼굴 움직임을 학습한 뒤 유튜브 동영상에서 사람들의 말과 노래를 관찰하여 음성과 입 모양의 관계를 익힌다.
이과정을 통해 소리의 파형과 입 움직임을 직접 연결하여 프랑스어, 아랍어, 중국어 발화가 가능해졌다. 실험 결과, 노래를 수행할 때 비교적 명확한 발음과 리듬을 보였지만 일부 파열음은 개선이 필요한 것으로 나타났다. 연구진은 이 기술이 대화형 휴머노이드와 AI 비서의 자연스러운 소통에 활용될 수 있을 것으로 전망하고 있다.