Солженицын разрабатывал теорию и методику артикуляционных испытаний телефонных каналов в разных режимах. А я читал и конспектировал книги и статьи по языкознанию, по фонетике, по акустике и электроакустике, по теории связи, по психологии речи, книги Сосюра, Щербы, Бодуэна, Марра, издания Пражского лингвистического кружка, статьи Габора, Эшби, Ликлайдера, Бекеши, американские, английские, французские, немецкие журналы.
Но читал я главным образом вечерами. А днем больше возился со звуковидами, торчал у АС, наговаривал тексты на магнитофонную ленту, потом натягивал ее на диск анализатора, получал звуковиды и рассматривал их, измерял, сравнивал...
Мне были поставлены отчетливые задачи: исследовать, в какой степени разборчивость речи и узнаваемость голоса в телефонах различного типа зависят от точности воспроизведения определенных параметров звуковых колебаний (частоты, энергии, соотношения частоты и энергии в разных - и каких именно - диапазонах частоты).
Во всех рассуждениях и спорах, которые возникали вокруг наших фонетико-акустических работ и захватывали почти всех, кто разрабатывал новые телефонные системы и отдельные узлы, были примерно такие главные темы:
- Сколько можно "сэкономить" (сократить) в диапазоне частоты? (При обычном разговоре "от рта к уху" на расстоянии одного-двух метров мы воспринимаем звуковые колебания с частотой от 60 до 15 тысяч герц. Обычный телефон передает ограниченную полосу от 100 до двух с половиной тысяч герц. Но и при передаче по более "узким" каналам речь все еще сохраняет некоторую разборчивость.) До каких пределов можно сократить канал? Что лучше срезать - верхние или нижние частоты?
- Если необходимо (в целях шифрации) передавать речь, разделяя ее фильтрами на отдельные частотные полосы, то какое именно деление наиболее благоприятно для разборчивости и узнаваемости?
- Как влияют на разборчивость речи, на узнавание говорящего различия в энергии, то есть амплитуды звуковых колебаний? До каких пределов можно их сокращать? До какой степени точно нужно воспроизводить различия между амплитудами в отдельных диапазонах частоты?
Такие конкретные, непосредственно технические вопросы были неотделимы от некоторых общетеоретических проблем:
- Что имеет решающее значение при восприятии речи: дискретные отдельные звуки или некие целостные "блоки" - слоги, слова, фразы - единицы смыслов?
- Чем отличается восприятие написанного текста от восприятия речи?
- Что быстрее и точнее? Можно ли эти различия измерять?
Звуковиды - то есть спектрограммы звуковых колебаний - позволяют увидеть распределение энергии по частоте в диапазоне примерно от 20 до 3000 герц. Те звуковиды, которые получали на АС-2 и АС-3, прорисовывали этот диапазон несколькими сотнями тончайших линий. Сергей сделал приспособление, позволяющее делать рисунок то более густым, то более редким. Степень резкости, потемнения отдельных участков каждой линии выражала более или менее высокую энергию (амплитуду) звуковых колебаний данной частоты и в данное мгновение (доли секунды). Такие спектрограммы позволяли добраться до тайников, которые раньше были недоступны ни лингвистам, ни акустикам, ни отоларингологам, ни логопедам...