Цифровата "говореща глава" се е научила да възпроизвежда човешки емоции

говореща

Запознайте се със „Зоуи“: това е цифрова „говореща глава“, която може да изразява човешки емоции при поискване с „безпрецедентен реализъм“

Разработчиците вярват, че това може да бъде началото на нова ера на взаимодействие човек-компютър.

Изследователите са разработили виртуална „говореща глава“, която е способна да изразява пълния набор от човешки емоции и може да се използва като цифров личен асистент, да замени четенето с физическо предаване на информация или да изпраща съобщения.

Дигиталното лице е в състояние да предава емоции като щастие, гняв и страх, като същевременно променя гласа според това, което потребителят иска да получи: могат да се задават различни параметри. Разработчиците твърдят, че това е най-изразителното управляемо цифрово лице, създавано някога.

Собствено лице вместо „Зоуи“

Системата, наречена Zoe, е резултат от сътрудничеството между изследователи от Изследователската лаборатория на Toshiba в Кеймбридж и Инженерния отдел на Университета в Кеймбридж. Студентите вече са установили прилики между дигиталната глава и Холи, бордовия компютър от британската научно-фантастична комедия „Червеното джудже“.

В основата на структурата Zoe е шаблон, който скоро ще позволи на потребителите да качват своите лица и гласове, което между другото ще отнеме само няколко секунди. Това означава, че в не много далечното бъдеще всеки ще може да персонализира своите собствени емоционални и реалистични цифрови асистенти.

Ако идеята на разработчиците бъде реализирана, потребителят ще може например да създаде съобщение „Закъснях“ и да прикачи към него емоцията „разстроен“. Ще има възможност за изпращане на живи съобщения, които ще предават лицето на подателя с такиваизражение и глас, каквото иска.

„Тази технология може да бъде началото на изцяло ново поколение интерфейси, които позволяват взаимодействие човек-компютър, което е по-скоро като двама истински хора“, казва професор Роберто Сиполия от инженерния отдел на университета в Кеймбридж. „Отне ни дни да създадем Zoe, защото трябваше да започнем от нулата и да научим системата да разбира езика и изражението на лицето. Сега, след като вече разполагаме с алгоритъма, настройването на различни лица и гласове няма да бъде голямо предизвикателство."

научила
Запознайте се със Zoe, цифровата говореща глава и интерфейс на бъдещето. Виртуалната говореща глава на Zoe използва основен набор от шест симулирани емоции, които могат да бъдат коригирани. Снимка от toshiba.eu

Безкрайно подобрение

Системата работи на базата на основните човешки емоции. Гласът на "Зоуи" например има шест основни настройки - щастлив, тъжен, нежен, ядосан, уплашен и неутрален. Потребителят може да регулира тези параметри по свой начин, всеки от които има няколко нива, както и да променя тона, скоростта и дълбочината на гласа.

С комбинацията от нива става възможно да се задават или създават почти безкрайни емоционални комбинации. Например, ако смесите щастието с нежността и добавите леко увеличаване на скоростта и дълбочината на гласа си, можете да получите много приятелски настроен и приветлив събеседник. Комбинацията от скорост, гняв и страх прави Зоуи много развълнувана, граничеща с паника. Така разработката успява много фино да предаде емоционалния компонент, което, както казват учените, не е било възможно в други подобни системи досега.

За да направите системата възможно най-реалистична, проучетеГрупата събра набор от данни от хиляди изказвания, които използваха, за да обучат модел на реч с помощта на актриса от реалния живот, Зоуи Листър. Учените създадоха математически алгоритми, които им дадоха глас и изображение на лицето и коригираха изражението на лицето и текста, така че да се получи жива и най-важното надеждна картина.

Сега изследователският екип ще работи върху създаването на версия на системата, която може да бъде персонализирана от самите потребители.

Днес взаимодействието между човек и компютър все още е ограничено до писане на клавиатурата и преместване на курсора с мишката, така че използването на компютър е трудна задача за много хора. В бъдеще разработчиците искат да отворят възможността за използване на компютър за повече хора, когато те могат да комуникират с машини по по-естествени начини - жестове или глас. Ето защо е създадена "Зоуи" - по-експресивно, емоционално отзивчиво лице, с което хората наистина могат да говорят, завършва Сиполия.