Цифровата "говореща глава" се е научила да възпроизвежда човешки емоции

Запознайте се със „Зоуи“: това е цифрова „говореща глава“, която може да изразява човешки емоции при поискване с „безпрецедентен реализъм“
Разработчиците вярват, че това може да бъде началото на нова ера на взаимодействие човек-компютър.
Изследователите са разработили виртуална „говореща глава“, която е способна да изразява пълния набор от човешки емоции и може да се използва като цифров личен асистент, да замени четенето с физическо предаване на информация или да изпраща съобщения.
Дигиталното лице е в състояние да предава емоции като щастие, гняв и страх, като същевременно променя гласа според това, което потребителят иска да получи: могат да се задават различни параметри. Разработчиците твърдят, че това е най-изразителното управляемо цифрово лице, създавано някога.
Собствено лице вместо „Зоуи“
Системата, наречена Zoe, е резултат от сътрудничеството между изследователи от Изследователската лаборатория на Toshiba в Кеймбридж и Инженерния отдел на Университета в Кеймбридж. Студентите вече са установили прилики между дигиталната глава и Холи, бордовия компютър от британската научно-фантастична комедия „Червеното джудже“.
В основата на структурата Zoe е шаблон, който скоро ще позволи на потребителите да качват своите лица и гласове, което между другото ще отнеме само няколко секунди. Това означава, че в не много далечното бъдеще всеки ще може да персонализира своите собствени емоционални и реалистични цифрови асистенти.
Ако идеята на разработчиците бъде реализирана, потребителят ще може например да създаде съобщение „Закъснях“ и да прикачи към него емоцията „разстроен“. Ще има възможност за изпращане на живи съобщения, които ще предават лицето на подателя с такиваизражение и глас, каквото иска.
„Тази технология може да бъде началото на изцяло ново поколение интерфейси, които позволяват взаимодействие човек-компютър, което е по-скоро като двама истински хора“, казва професор Роберто Сиполия от инженерния отдел на университета в Кеймбридж. „Отне ни дни да създадем Zoe, защото трябваше да започнем от нулата и да научим системата да разбира езика и изражението на лицето. Сега, след като вече разполагаме с алгоритъма, настройването на различни лица и гласове няма да бъде голямо предизвикателство."

Безкрайно подобрение
Системата работи на базата на основните човешки емоции. Гласът на "Зоуи" например има шест основни настройки - щастлив, тъжен, нежен, ядосан, уплашен и неутрален. Потребителят може да регулира тези параметри по свой начин, всеки от които има няколко нива, както и да променя тона, скоростта и дълбочината на гласа.
С комбинацията от нива става възможно да се задават или създават почти безкрайни емоционални комбинации. Например, ако смесите щастието с нежността и добавите леко увеличаване на скоростта и дълбочината на гласа си, можете да получите много приятелски настроен и приветлив събеседник. Комбинацията от скорост, гняв и страх прави Зоуи много развълнувана, граничеща с паника. Така разработката успява много фино да предаде емоционалния компонент, което, както казват учените, не е било възможно в други подобни системи досега.
За да направите системата възможно най-реалистична, проучетеГрупата събра набор от данни от хиляди изказвания, които използваха, за да обучат модел на реч с помощта на актриса от реалния живот, Зоуи Листър. Учените създадоха математически алгоритми, които им дадоха глас и изображение на лицето и коригираха изражението на лицето и текста, така че да се получи жива и най-важното надеждна картина.
Сега изследователският екип ще работи върху създаването на версия на системата, която може да бъде персонализирана от самите потребители.
Днес взаимодействието между човек и компютър все още е ограничено до писане на клавиатурата и преместване на курсора с мишката, така че използването на компютър е трудна задача за много хора. В бъдеще разработчиците искат да отворят възможността за използване на компютър за повече хора, когато те могат да комуникират с машини по по-естествени начини - жестове или глас. Ето защо е създадена "Зоуи" - по-експресивно, емоционално отзивчиво лице, с което хората наистина могат да говорят, завършва Сиполия.