Ще в 1950 році Алан Тьюринг придумав тест, який був покликаний відрізнити робота від людини. У той час ще й гадки не мали, що в XXI столітті можна буде попросити пошукового асистента на смартфоні знайти що завгодно, а штучний інтелект зможе писати пісні і оцінювати популярність ваших майбутніх постів в Instagram.
В наш час вчені пішли далі і провели експеримент, який назвали «Мінімальним тестом Тюрінга». Учасникам потрібно було представити, що вони стоять перед певним суддею на пару з роботом. Суддя не знає, хто є хто, але мушу вбити робота. Щоб довести, що ви не машина, пропонувалося вибрати одне слово, яке і буде сказано судді. Ми в woman.net.ua вирішили реалізувати свою версію експерименту, результати якої чекають вас у другій половині статті.
Як проходив експеримент і які лідирували слова?
Вчені спочатку опитали близько 1 000 учасників в режимі онлайн. Найпопулярнішими на цій стадії експерименту були слова, пов’язані з емоціями: «любов», «спасибі» (близько 2,7 %). Часто називали абстрактні емоції, їжу, слова «Бог» та «Ісус», роботів і тварин, сім’ю. На піку популярності — слова «душа», «людина», «будь ласка».
Були і незвичайні слова, вигадані вирази, сленг, скорочення: yolo, noob, oops, lol, omg, huh?. Не обійшлося і без «термінатора».
Вчені підкреслили, що назвати «Мінімальний тест Тьюринга» безпечним складно, адже він насправді навряд чи допоміг би судді визначити, хто людина, а хто робот, з високою точністю. Опитавши 1 000 учасників, автори експерименту пішли далі і попросили нових випробовуваних оцінити пари слів, які були сформовані з відповідей. Стояло завдання визначити, яке слово з пари сказав чоловік, а який згенерував робот або штучний інтелект (учасники експерименту не знали, що обидва слова в парі були сказані людиною). Самим «людяним» після оцінки таких пар виявилося слово «лайно» — poop.
Ми вирішили повторити цей експеримент
Так як в оригінальному експерименті брали участь тільки англомовні учасники, ми повторили його з російськомовною аудиторією, щоб порівняти результати. Для цього опитали близько 70 осіб. До того ж ми вирішили подивитися, як буде змінюватися настрій учасників, якщо суддя з першого разу їм не повірить і ситуація загостриться. Ми трохи змінили умови експерименту: нашим випробуваним було запропоновано 3 шансу замість одного.
Найчастішими відповідями серед опитаної аудиторії стали вигадані слова: «грустечувствительный», «паникопроводимость». Ці слова навряд чи є навіть в самій широкій базі робота, так як вони не зафіксовані у словниках, але їх зміст ми загалом можемо вловити. Були і вигадані слова, сенс яких довелося розшифровувати: «Я б назвала слово „курмымзлик“. Це наше родинне слово, що позначає людину, яка виглядає приблизно як ображений ховрах, промокла під дощем». Один з учасників запропонував вигадане Довлатовим слово «абанамат».
Не менш активно пропонували слова зі зменшувально-пестливими суфіксами — з урахуванням того, що робот, швидше за все, їх не буде: «огогошеньки», «печальна». Активно називали і їжу, причому теж з суфіксами: «картопелька», «шашличок». Серед збіглися з англомовної аудиторією слів були найпопулярніші варіанти з оригінального експерименту: «любов», «душа», «мама», «уява».
Багато хто вже на другий-третій спробі припускали, що скажуть щось нецензурне (деякі учасники навіть збиралися зробити вигадане вираз із декількох нецензурних слів, припускаючи, що непристойні вирази все-таки є в базі штучного інтелекту).
Деякі учасники експерименту робили ставку не тільки на зміст сказаного, але й на емоційність, яку вони будуть при цьому виражати:
- «Тицьнула б робота пальцем, пильно подивилася в очі судді і сказала: „Фальшивка!“ І зробила б це так, як ні один робот не зміг би: емоційно».
- «Як варіант — „ачхи!“. Я починаю говорити: „Розумієте, ваша честь… Ачхи!.. Я хотів сказати…“ Суддя: „Не продовжуйте, справу закрито!“»
Багато хто просто озвучували слова з емоційним забарвленням («очманіти», «жерти», «голодомор») або просто питальні слова («посадіть?», «підписатися?»). Деякі вибирали вирази, які означають щось саме для них: «Я б назвала своє місто», «Назвала своє ім’я», «Я б назвала ім’я людини, якого люблю. Хоча ні… Ім’я свого кота. Так».
Було і кілька осіб, які обрали просто мовчати. Один з учасників пояснив це тим, що робот не зможе ослухатися наказу судді (якщо він так запрограмований, звичайно), тому він у будь-якому випадку щось скаже. А мовчання доведе судді, що перед ним людина. Інший учасник експерименту вибрав мовчання просто тому, що марно було б щось говорити судді, тому що нинішній штучний інтелект можна навчити і нецензурних висловів, і вигаданим словами, і взагалі чого завгодно.
Один з учасників на третій раз сказав би слово «Станіславський» (якби суддя відповідав «не вірю» на попередні варіанти відповіді). Хоч робота в базі, швидше за все, і була б ця прізвище, але не факт, що він загорнув таку логічний ланцюжок, і був би шанс на порятунок. Інший учасник третім варіантом сказав би слово «шкода», аргументуючи це тим, що робот не став би називати завідомо програшне слово. Він би генерував тільки кращі варіанти, і таким чином суддя міг би зрозуміти, хто саме людина.
В кінці експерименту вчені підкреслили, що його можна використовувати для перевірки інших стереотипів. Яке слово, на думку людей, скаже жінка чи старий? Незважаючи на розвиток штучного інтелекту, який сьогодні, здається, здатний на що завгодно, учасники й англомовного, і нашого експерименту змогли придумати варіанти, які навіть самий розумний робот не зміг би назвати. Не так легко вигадати слово або скласти вираз із декількох існуючих, яке буде сприйматися на слух і мати сенс. З іншого боку, якщо б потрібно було називати тільки слова зі словника, відрізнити людину від розумного робота було б практично неможливо. В такому випадку, краще було б підібрати інші методи перевірки.
І найцікавіше! Що в такій ситуації сказали б ви?