UX, 뉴스

OpenAI 음성 엔진:15초면 복제되는 목소리

4월 5, 2024
ai, openai, ui/ux, ux, VoiceEngine, 디자인, 사용자경험, 인터랙션

OpenAI가 15초 정도 길이의 샘플로 화자의 목소리로 말하는 오디오를 만드는 ‘보이스 엔진(Voice Engine)’을 공개했습니다. 2022년에 처음 만들어 읽기, 번역, 비언어 사용자 지원, 장애 개선 등 용도를 확인하고 소규모 그룹과 테스트해 왔다고 합니다.

AI로 음성을 만드는 서비스가 많지만 비교가 되지 않는 품질을 보여줍니다. OpenAI가 ChatGPT처럼 대중에게 유용할만큼 수준을 끌어올려 널리 퍼뜨리는 것에 익숙해진 것처럼 보입니다.

©OpenAI

OpenAI의 블로그 게시글에서 샘플을 확인할 수 있습니다. 15초 길이의 샘플을 준비하고글 단락을 추가하면 자연스럽게 읽어줍니다. 다양한 분야에 관한 짧은 문장을 개인의 목소리 특성이 담긴 오디오로 만들어 줍니다. 영어로 읽은 샘플을 바탕으로 스페인어, 중국어, 독일어, 프랑스어, 일본어로 생성할 수도 있습니다.

©OpenAI

언어 장애가 있는 사람의 샘플을 사용해도 자연스러운 오디오를 생성할 수 있습니다. 일상생활에서 소통하기 위한 언어를 본인의 목소리로 말할 수 있습니다. 기존 텍스트 투 스피치(Text to Speech)와 다르게 기계가 읽는 느낌이 적어 더 편하게 사용할 수 있을 것으로 보입니다.

©OpenAI

OpenAI는 교육과 건강과 같이 인류적 가치에 기여할 수 있는 회사와 협업한다고 강조하지만 가장 위험한 기술입니다. 글은 본래 복제가 쉬워 진위 여부에 관한 경각심이 있고 영상은 아직은 완벽하게 속일 수 있을만큼 자연스럽게 만들기가 어렵죠.

LIVOX:AI 대체 의사소통 앱

Dimagi: 지역사회 보건 종사자들이 모유 수유 중인 엄마들을 위한 서비스

Lifespan:브라운 대학교 의과대학 비영리 의료 시스템

HeyGen: AI 시각적 스토리텔링 플랫폼

하지만 목소리는 다릅니다. 15초 길이의 샘플을 구하기가 너무나 쉽고 듣는 이가 진위 여부를 판별하기가 훨씬 더 어렵습니다. 은행 계좌를 만들 때 음성으로 인증하는 것은 앞으로 어려워질 것 같네요. 심지어 얼마전 미국에서는 조 바이든 대통령의 목소리를 복제해 뉴햄프셔 민주당원들에게 투표하지 말라고 독려하는 자동 녹음 전화가 돌기도 했습니다.

©OpenAI

©OpenAI

현재는 제한된 회사에서만 사용할 수 있으며 목소리를 생성할 때 음성 제공자의 동의를 받아야 하며 AI로 음성을 만들었음을 청취자에게 공개합니다. 오디오 클립에 워터마크를 추가해 출처를 드러내고 유통을 추적한다고 합니다.

하지만 이것만으로는 충분하지 않다는 생각이 듭니다. 개인간의 차이를 없애고 획일된 정답을 추구하게 만드는 다양성 위기, 보이지 않는 개인 사유 재산의 보호에 관한 대비가 절실한 것 같습니다.

더 보기 및 출처

https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices

인기

lotteria-rebranding-01

롯데리아 리브랜딩: 불고기 버거에서 리아 불고기로

toss-stock-pc-01

토스 증권 PC 출시: 증권 서비스도 디자인 혁신

musinsa-desktop-quit-01

무신사 PC 버전 종료: 넘쳐 버린 개발 부채

최근

window11-design

마이크로소프트 윈도우 11 비주얼 디자인

cmf-phone

slack-ios-widget

슬랙 iOS 위젯

디자인 나침반 아카데미

thumbnail-course-list-ux

UX 디자인 클래스: 선택 받는 서비스를 위한 UX 디자인

ui-design-main-mobile

UI 디자인 클래스: 변치 않을 인터페이스의 본질 배우기

최근 소식

dyson-ontrac-01

오브젝트

다이슨 온트랙: 충격적인 마스크는 없어졌다

다이슨이 하이파이 오디오 전용 블루투스 헤드폰 ‘다이슨 온트랙(Dyson OnTrac)’을 18일 공개했습니다. 감각적인 색과...

q10-accident-01

UX

티몬,위메프 사태: 결제가 막히고 환불도 할 수도 없다.

티몬과 위메프에서 판매자 대금 정산 지연 사태가 벌어졌습니다. 작년부터 문제가 있던 대금 정산 문제가 해결되지 않아 결국 판매자와...

harrisforpresident-01

브랜드

해리스 카말라: 바이든의 잇는 다문화 끝판왕 미 대선 후보

바이든 대통령이 2024년 경선에서 중도에 하차했습니다. 부통령 해리스가 민주당의 대통령 후보로 지정되었습니다. 미국은 대통령...

ms-cloud-error-01

UX

MS 클라우드 장애: 전 세계가 멈췄다

지난 금요일 전 세계 항공사 시스템, 게임, 방송, 은행 전산이 마비되었습니다. 크라우드스트라이크(CrowdStrike)의 보안...

lotteria-rebranding-01

브랜드

롯데리아 리브랜딩: 불고기 버거에서 리아 불고기로

롯데리아가 12년 만에 리브랜딩했습니다. 롯데리아는 한국 최초의 햄버거 프랜차이즈로 개점한 지 45년이 되었습니다. 전국 어디서나...

toss-stock-pc-01

UX

토스 증권 PC 출시: 증권 서비스도 디자인 혁신

토스증권이 토스증권 PC 서비스를 정식 출시했습니다. 토스증권 PC는 기존 토스 앱으로 사용할 수 있었던 모바일 트레이딩 시스템(MTS)을...

cfcldn-01

브랜드

챌시 FC 리브랜딩: 푸르게 타오르는 열정

첼시 FC가 크리에이티브 스튜디오 언커먼(Uncommon)과 협업해 리브랜딩했습니다. 전통적인 가문 문장과 같은 인상에서 현대적이고...

kakao-id-card-01

UX

카카오 톡사원증: 킹차갓무직도 보일까?

카카오가 직장인을 위한 톡디지털카드 서비스 ‘카카오 톡사원증’을 15일 출시했습니다. 톡사원증은 카카오톡 지갑에서 발급하고 보관할...

Channela-rebranding-01

브랜드

채널 A 리브랜딩: 즐거움을 담은 3D 로고

채널 A가 플러스엑스와 협업해 리브랜딩했습니다. 채널 A는 동아일보가 “당신의 꿈을 담은 캔버스”이라는 슬로건으로 2011년 개국해...

baemin-increase-price-01

UX

배민 대대적 개편: 수수료 높아지고 앱 메인도 바뀐다

배달 앱 경쟁이 심해지면서 배민에 큰 변화가 생기고 있습니다. 가장 저렴했던 배달 중개 수수료가 6.8%에서 9.8%로 인상됩니다....

galaxy-ring-01

UX

갤럭시 링: 건강 관리의 미래

몇 달간 티저로 기대감을 높인 삼성의 갤럭시 링이 드디어 공개됐습니다. 삼성은 프랑스 파리에 위치한 ‘카루젤 뒤 루브르(Carrousel...

olympic-uniform-01

브랜드

올림픽 유니폼 디자인: 세상에서 가장 역동적인 패션쇼

2024년 파리에서 개최되는 하계 올림픽 및 패럴림픽을 위한 선수복이 하나씩 공개되고 있습니다. 이번 올림픽은 명품 제국 LVMH의...

디자인 나침반
뉴스레터

매주 화요일 아침, 16년 차 디자이너가 큐레이션한 디자인 트렌드를 모아보세요.

이용약관 개인정보취급방침 마케팅수신동의 광고/제휴문의 고객센터

대표: 박종민 개인정보책임관리자: 박종민 사업자번호: 502-41-91539 주소: 서울특별시 종로구 옥인1길 19-4, 301호(옥인동)
통신판매업 신고번호: 2023-서울마포-0310 이메일: help@designcompass.org 전화번호: 07080803192

© 2024 디자인 나침반 .All rights reserved.