Куль П.К., Миллер Д.Д. Восприятие речи шиншиллой: функция идентификации синтетических стимулов времени появления голоса
Тип статьи:
перевод
Вид статьи:
экспериментальная статья
Введение
-
Для учета данных при речевом эксперименте полезно различать слуховые уровни обработки и фонетические уровни обработки.
-
Доказательства, подтверждающие дихотомию между двумя уровнями:
- отсутствие акустической инвариантности между акустическими сигналами и нашим восприятием (Liberman et al., 1967)
- обнаружение перцептивного поведения, такого как восприятие категорий
- данные исследований селективной адаптации
Вопросы о дихотомии
-
Инвариантные сигналы для стоп-согласных можно найти в динамических конфигурациях спектральной энергии во времени (Fant (1973), Stevens (1975)).
-
Перцептивное поведение было продемонстрировано для сложных неречевых сигналов (Pisoni, 1977)
-
Эффекты избирательной адаптации, которые, как считается, служат подтверждением для детекторов фонетических свойств, теперь, по-видимому, относятся к слуховым.
Решение
-
Прямой тест на различие между слуховым и фонетическим уровнями обработки заключается в использовании в качестве слушателя животного, которое не имеет фонетических ресурсов.
-
Основанием для этого сравнительного подхода является отделение перцептивных эффектов от тех, которые являются уникальными для обработки речи и звука.
Предыдущие анализы
-
Liberman et al.(1967): категориальное восприятие считается уникальным для обработки звуков речи.
-
Для неречевых стимулов: Cutting and Rosner (1974) - «сорванный» или «искривленный», Pisoni (1977).
-
Eimas (1974b): младенцы воспринимают стимулы в лингвистическом режиме и могут категорически различать голосовые контрасты, которые не являются фонемическими в языковой среде младенца.
-
Kuhl (1978): Хотя склонность ребенка к восприятию имеет лингвистическое значение, её происхождение может отражать психоакустические ограничения, а не специфические лингвистические.
Цели
-
В попытке дифференцировать эффекты восприятия, которые относятся к «слуховому» и «фонетическому» уровням обработки при восприятии речи Kuhl & Moller (1977) предприняли серию экспериментов с животными в качестве слушателей.
-
Результаты, полученные с альвеолярными стимулами, сообщаются в эксперименте I; результаты, полученные с помощью губных и велярных стимулов, сообщаются в экспериментах II и III.
-
Эксперимент IV представляет собой отчет о результатах, полученных при использовании стимулов из всех трех континуумов.
Эксперимент I
-
Стимулы
-
Звуки речи были синтезированы в лабораториях Хаскинса на синтезаторе с параллельным резонансом.
-
Для определенного времени появления голоса два верхних форманта возбуждались тепловым шумом в течение интервала; в конце этого интервала два форманта возбуждались периодическими импульсами.
-
Первый формант был выключен в течение интервала времени появления голоса. 5 мс для b/p и d/t, 20 мс для g/k стимулов.
-
Время появления голоса от 0 до 80 мс с шагом 10 мс, записывалось на полноразмерный магнитофон, а затем перезаписывалось на пакет магнитных дисков RAP.
Субъекты
-
Четыре шиншиллы, каждая в возрасте около двух лет.
-
Двое из четырех животных были предварительно обучены классифицировать альвеолярные токены естественного происхождения такие как звуки / d / или / t /.
-
Двое других животных никогда не обучались.
-
Четверо англоязычных взрослых людей.
Аппаратура
-
Клетка с двойной решеткой и громкоговорителем в звукоизолированной кабине.
-
Клетка разделена барьером по средней линии и имеет дверной звонок на одном конце.
-
Представление звука речи было инициировано экспериментатором и контролировалось перфорированной бумажной лентой и высокоскоростным считывателем бумажной ленты.
-
Перфолента была подготовлена в соответствии со спецификациями рандомизации.
Дискриминационное обучение
-
При положительном исходе испытания животное должно было пересечь барьер на средней линии, чтобы избежать легкого шока и не находиться вблизи звонка.
-
При отрицательном исходе испытания животное могло остаться в питьевой трубе. Если животное успешно подавляло перекрестный ответ, оно вознаграждалось водой.
-
В конце этого эксперимента два животных научились правильно классифицировать голосовые и глухие CV-звуки, воспроизводимые восемью разными говорящими в шести разных контекстах гласных.
-
Рандомизация положительных и отрицательных исходов испытаний с помощью компьютерных перфорированных бумажных лент.
Обобщающее тестирование
-
В половине испытаний: стимулы конечной точки, 0 и +80 мс от времени появления голоса.
-
В другой половине испытаний: стимулы между этими конечными точками, от +10 до +70 мс от времени появления голоса.
-
Во время обобщающего тестирования никогда не проявлялся шок, и все ответные реакции были организованы так, чтобы сказать животному, что оно всегда делает все правильно.
-
Тестирование людей:
- Четыре человека в одинаковой аудиометрической комнате
- Одинаковая структура эксперимента
- Поручено отмечать стимулы как / da / или / ta /.
Результаты эксперимента I
-
Расположение фонетических границ:
- Фонетические границы кривых, построенных по экспериментальным точкам: время появления голоса - 35,2 мс для англоязычных взрослых, время появления голоса - 33,3 мс для шиншилл.
- Диапазон граничных значений: 29,9 мс -42,0 мс для человека, 26,7 мс -36 мс для шиншиллы.
- Воздействие естественной речи не влияло на местоположение границы.
a. двое обученных животных - 31,4 мс VOT
b. двое животных без дрессировки - 32,8 мс VOT
Эксперимент II
-
Субъекты
- Две из четырех шиншилл, использованных в эксперименте I использовались в качестве субъектов.
- Одна изначально обучалась восприятию естественной речи, в то время как другая обучалась только синтетическим токенам.
- Те же четверо англоязычных взрослых.
Результаты эксперимента II
-
Переход от альвеолярных стимулов к стимулам с лабиальным расположением артикуляции.
-
Расположение фонетических границ: фонетические границы кривых, построенным по экспериментальным точкам, составляют 26,8 мс VOT для англоязычных взрослых и 23,3 мс для шиншилл.
-
Ширина границы: кривая, построенная по экспериментальным точкам, для каждого субъекта соответствовала на 50%.
Эксперимент III
-
Субъекты: те же субъекты, что и в эксперименте II.
-
Процедура
-
Дискриминационное обучение
-
Обобщающее тестирование
-
Результаты
-
Переход к стимулам с задненебным местом артикуляции
-
50% точек согласованных кривых: 42,3 мс VOT для англоговорящих взрослых, 42,5 мс VOT для шиншилл.
-
Согласованная кривая каждого субъекта соответствовала 50% точек.
Эксперимент IV
-
Стимулы: использовались лабиальные, альвеолярные и задненебные стимулы, описанные ранее.
-
Предмет: одно животное, для которого озвученные стимулы были положительными.
-
Процедура:
-
Дискриминационное обучение: со стимулами конечной точки (0 мс VOT и +80 мс VOT) для всех трех континуумов.
-
Обобщающее тестирование: шесть стимулов в конечных точках и 21 стимул между конечными точками (от +10 мс VOT до +70 мс VOT от лабиальных, альвеолярных и задненебных континуумов)
Результаты эксперимента IV
-
Расположение фонетических границ:
- Относительные местоположения трех границ не менялись, когда место артикуляции менялось случайным образом.
-
Ширина границы: ширина границ кривых, построенных по экспериментальным точкам, из эксперимента I, II и III очень похожа на ширину из эксперимента IV.
Статистический анализ
-
Фонетическая граница
- Двухфакторный дисперсионный анализ (вид х место артикуляции)
- Хотя главный эффект вида был незначительным (F = 0,376), основной эффект места артикуляции был очень значительным (р <0,001).
- Нет значимых взаимодействий.
-
Ширина границы
- Двухфакторный дисперсионный анализ.
- Оба основных вида (р <0,05) и места артикуляции (р <0,05) были значимыми.
- Нет значимых взаимодействий.
- Самые крутые склоны функции идентификации – небные стимулы.
- Самые слабонаклонные функции – лабиальные стимулы.
Обсуждение
-
Сравнение функций «маркировки» для слушателей-людей и не являющихся людьми
-
Согласованность между функциями идентификации у людей и животных для всех трех наборов стимулов
- Наклонность функций чуть менее сильная для шиншилл.
-
Сдвиг граничных значений с местом артикуляции одинаков для двух групп субъектов.
- Дополнительная связь между VOT и F1-начальной частотой.
- Чем ниже начальная частота F1, тем больше VOT.
B. Смысл теорий речевого восприятия и эволюции речевого и звукового репертуара.
- Млекопитающее с соответствующими слуховыми способностями и отсутствием лингвистического опыта предрасположено к тому, чтобы слышать резкое качественное изменение в области короткого озвончения с запаздыванием VOT.
- Рассмотрение психоакустики при отборе кандидатов для речевого и звукового репертуара.
- Звуки речи были выбраны для использования разрывов восприятия, которые являются естественным результатом функционирования слуховой системы млекопитающих.
С. Интерпретации восприятия человеческого младенца
- Образованность ребенка может отражать психоакустическую предрасположенность, благоприятствующую восприятию речи и звука (Kuhl, 1978).
D. Изучение природы сложного слухового восприятия с использованием «модельного» животного.
Авторы: Patrica K. Kuhl & James D. Miller
JASA (1977)
Patrica K. Kuhl, James D. Miller. Speech perception by the chinchilla: Identification functions for synthetic VOT stimuli // The Journal of the Acoustical Society of America 63(3): 905-917 · March 1978
Файл с оригиналом статьи:
Все права защищены.
Использование материалов (текста и изображений) разрешается при условии ссылки на "Социальную сеть любителей шиншилл CHINBOX" (chinbox.online). Для интернет-изданий обязательной является прямая гиперссылка, не закрытая от индексации поисковыми системами (отсутствие в ссылке rel="nofollow" или ‹noindex› ), в первом или втором абзаце опубликованного материала (ссылка должна быть в тексте).