Куль П.К., Миллер Д.Д. Восприятие речи шиншиллой: функция идентификации синтетических стимулов времени появления голоса

Тип статьи:
перевод
Вид статьи:
экспериментальная статья
 

Введение

  • Для учета данных при речевом эксперименте полезно различать слуховые уровни обработки и фонетические уровни обработки.
  • Доказательства, подтверждающие дихотомию между двумя уровнями:
- отсутствие акустической инвариантности между акустическими сигналами и нашим восприятием (Liberman et al., 1967)
- обнаружение перцептивного поведения, такого как восприятие категорий
- данные исследований селективной адаптации

Вопросы о дихотомии

  • Инвариантные сигналы для стоп-согласных можно найти в динамических конфигурациях спектральной энергии во времени (Fant (1973), Stevens (1975)).
  • Перцептивное поведение было продемонстрировано для сложных неречевых сигналов (Pisoni, 1977)
  • Эффекты избирательной адаптации, которые, как считается, служат подтверждением для детекторов фонетических свойств, теперь, по-видимому, относятся к слуховым.

Решение

  • Прямой тест на различие между слуховым и фонетическим уровнями обработки заключается в использовании в качестве слушателя животного, которое не имеет фонетических ресурсов.
  • Основанием для этого сравнительного подхода является отделение перцептивных эффектов от тех, которые являются уникальными для обработки речи и звука.

Предыдущие анализы

  • Liberman et al.(1967): категориальное восприятие считается уникальным для обработки звуков речи.
  • Для неречевых стимулов: Cutting and Rosner (1974) - «сорванный» или «искривленный», Pisoni (1977).
  • Eimas (1974b): младенцы воспринимают стимулы в лингвистическом режиме и могут категорически различать голосовые контрасты, которые не являются фонемическими в языковой среде младенца.
  • Kuhl (1978): Хотя склонность ребенка к восприятию имеет лингвистическое значение, её происхождение может отражать психоакустические ограничения, а не специфические лингвистические.

Цели

  • В попытке дифференцировать эффекты восприятия, которые относятся к «слуховому» и «фонетическому» уровням обработки при восприятии речи Kuhl & Moller (1977) предприняли серию экспериментов с животными в качестве слушателей.
  • Результаты, полученные с альвеолярными стимулами, сообщаются в эксперименте I; результаты, полученные с помощью губных и велярных стимулов, сообщаются в экспериментах II и III.
  • Эксперимент IV представляет собой отчет о результатах, полученных при использовании стимулов из всех трех континуумов.

Эксперимент I

  1. Стимулы

  • Звуки речи были синтезированы в лабораториях Хаскинса на синтезаторе с параллельным резонансом.
  • Для определенного времени появления голоса два верхних форманта возбуждались тепловым шумом в течение интервала; в конце этого интервала два форманта возбуждались периодическими импульсами.
  • Первый формант был выключен в течение интервала времени появления голоса. 5 мс для b/p и d/t, 20 мс для g/k стимулов.
  • Время появления голоса от 0 до 80 мс с шагом 10 мс, записывалось на полноразмерный магнитофон, а затем перезаписывалось на пакет магнитных дисков RAP.

Субъекты

  • Четыре шиншиллы, каждая в возрасте около двух лет.
  • Двое из четырех животных были предварительно обучены классифицировать альвеолярные токены естественного происхождения такие как звуки / d / или / t /.
  • Двое других животных никогда не обучались.
  • Четверо англоязычных взрослых людей.
 

Аппаратура

  • Клетка с двойной решеткой и громкоговорителем в звукоизолированной кабине.
  • Клетка разделена барьером по средней линии и имеет дверной звонок на одном конце.
  • Представление звука речи было инициировано экспериментатором и контролировалось перфорированной бумажной лентой и высокоскоростным считывателем бумажной ленты.
  • Перфолента была подготовлена в соответствии со спецификациями рандомизации.

Дискриминационное обучение

  • При положительном исходе испытания животное должно было пересечь барьер на средней линии, чтобы избежать легкого шока и не находиться вблизи звонка.
  • При отрицательном исходе испытания животное могло остаться в питьевой трубе. Если животное успешно подавляло перекрестный ответ, оно вознаграждалось водой.
  • В конце этого эксперимента два животных научились правильно классифицировать голосовые и глухие CV-звуки, воспроизводимые восемью разными говорящими в шести разных контекстах гласных.
  • Рандомизация положительных и отрицательных исходов испытаний с помощью компьютерных перфорированных бумажных лент.

Обобщающее тестирование

  • В половине испытаний: стимулы конечной точки, 0 и +80 мс от времени появления голоса.
  • В другой половине испытаний: стимулы между этими конечными точками, от +10 до +70 мс от времени появления голоса.
  • Во время обобщающего тестирования никогда не проявлялся шок, и все ответные реакции были организованы так, чтобы сказать животному, что оно всегда делает все правильно.
  • Тестирование людей:
- Четыре человека в одинаковой аудиометрической комнате
- Одинаковая структура эксперимента
- Поручено отмечать стимулы как / da / или / ta /.
 
 

Результаты эксперимента I

  • Расположение фонетических границ:
- Фонетические границы кривых, построенных по экспериментальным точкам: время появления голоса - 35,2 мс для англоязычных взрослых, время появления голоса -  33,3 мс для шиншилл.
- Диапазон граничных значений: 29,9 мс -42,0 мс для человека, 26,7 мс -36 мс для шиншиллы.
- Воздействие естественной речи не влияло на местоположение границы.
a. двое обученных животных - 31,4 мс VOT
b. двое животных без дрессировки - 32,8 мс VOT

Эксперимент II

  • Субъекты

- Две из четырех шиншилл, использованных в эксперименте I использовались в качестве субъектов.
- Одна изначально обучалась восприятию естественной речи, в то время как другая обучалась только синтетическим токенам.
- Те же четверо англоязычных взрослых.

Результаты эксперимента II

  1. Переход от альвеолярных стимулов к стимулам с лабиальным расположением артикуляции.
  2. Расположение фонетических границ: фонетические границы кривых, построенным по экспериментальным точкам, составляют 26,8 мс VOT для англоязычных взрослых и 23,3 мс для шиншилл.
  3. Ширина границы: кривая, построенная по экспериментальным точкам, для каждого субъекта соответствовала на 50%.
 

Эксперимент III

  • Субъекты: те же субъекты, что и в эксперименте II.
  • Процедура
  1. Дискриминационное обучение
  2. Обобщающее тестирование
  • Результаты
  1. Переход к стимулам с задненебным местом артикуляции
  2. 50% точек согласованных кривых: 42,3 мс VOT для англоговорящих взрослых, 42,5 мс VOT для шиншилл.
  3. Согласованная кривая каждого субъекта соответствовала 50% точек.

Эксперимент IV

  • Стимулы: использовались лабиальные, альвеолярные и задненебные стимулы, описанные ранее.
  • Предмет: одно животное, для которого озвученные стимулы были положительными.
  • Процедура:
  1. Дискриминационное обучение: со стимулами конечной точки (0 мс VOT и +80 мс VOT) для всех трех континуумов.
  2. Обобщающее тестирование: шесть стимулов в конечных точках и 21 стимул между конечными точками (от +10 мс VOT до +70 мс VOT от лабиальных, альвеолярных и задненебных континуумов)

Результаты эксперимента IV

  • Расположение фонетических границ:
- Относительные местоположения трех границ не менялись, когда место артикуляции менялось случайным образом.
  • Ширина границы: ширина границ кривых, построенных по экспериментальным точкам, из эксперимента I, II и III очень похожа на ширину из эксперимента IV.

Статистический анализ

  • Фонетическая граница
- Двухфакторный дисперсионный анализ (вид х место артикуляции)
- Хотя главный эффект вида был незначительным (F = 0,376), основной эффект места артикуляции был очень значительным (р <0,001).
- Нет значимых взаимодействий.
  • Ширина границы
- Двухфакторный дисперсионный анализ.
- Оба основных вида (р <0,05) и места артикуляции (р <0,05) были значимыми.
- Нет значимых взаимодействий.
- Самые крутые склоны функции идентификации – небные стимулы.
- Самые слабонаклонные функции – лабиальные стимулы.
 
 

Обсуждение

  1. Сравнение функций «маркировки» для слушателей-людей и не являющихся людьми
  • Согласованность между функциями идентификации у людей и животных для всех трех наборов стимулов
- Наклонность функций чуть менее сильная для шиншилл.
  • Сдвиг граничных значений с местом артикуляции одинаков для двух групп субъектов.
- Дополнительная связь между VOT и F1-начальной частотой.
- Чем ниже начальная частота F1, тем больше VOT.
B. Смысл теорий речевого восприятия и эволюции речевого и звукового репертуара.
     - Млекопитающее с соответствующими слуховыми способностями и отсутствием лингвистического опыта предрасположено к тому, чтобы слышать резкое качественное изменение в области короткого озвончения с запаздыванием VOT.
- Рассмотрение психоакустики при отборе кандидатов для речевого и звукового репертуара.
- Звуки речи были выбраны для использования разрывов восприятия, которые являются естественным результатом функционирования слуховой системы млекопитающих.
С. Интерпретации восприятия человеческого младенца
- Образованность ребенка может отражать психоакустическую предрасположенность, благоприятствующую восприятию речи и звука (Kuhl, 1978).
D. Изучение природы сложного слухового восприятия с использованием «модельного» животного.
 
 

Авторы: Patrica K. Kuhl & James D. Miller

JASA (1977)
 
 
Patrica K. Kuhl, James D. Miller. Speech perception by the chinchilla: Identification functions for synthetic VOT stimuli // The Journal of the Acoustical Society of America 63(3): 905-917 · March 1978
 
Файл с оригиналом статьи:
Все права защищены. Использование материалов (текста и изображений) разрешается при условии ссылки на "Социальную сеть любителей шиншилл CHINBOX" (chinbox.online). Для интернет-изданий обязательной является прямая гиперссылка, не закрытая от индексации поисковыми системами (отсутствие в ссылке rel="nofollow" или ‹noindex› ), в первом или втором абзаце опубликованного материала (ссылка должна быть в тексте).
216