Отправляет email-рассылки с помощью сервиса Sendsay
  Все выпуски  

Англоматика: Как держать в форме свой английский - выпуск № 13


Рубрика : Держим форму !

Как быстро обработать множество слов из субтитров и свести всё в таблицу?

Как эффективно работать с субтитрами и иными текстами вручную, мы рассмотрели в предыдущих статьях на блоге (и в выпусках рассылки). Но ведь компьютерные программы и онлайн-сервисы могут в разы увеличить эту эффективность! Давайте сначала посмотрим, что можно сделать с помощью домашнего компьютера.


Практически на каждом компьютере имеется программа работы с электронными таблицами - Excel, Calc или какая-нибудь другая. Принципы работы с ними сейчас изучают в средней школе; имеется обширная литература, многое размещено в Интернете. Поэтому я не буду давать уроки работы с электронными таблицами, приведу лишь пример обработки субтитров трейлера к фильму "47 ронинов / 47 RONIN" (см. ролик). Вот текст субтитров:

  • I am looking for someone who was sold to you. 
  • A half-breed, banished from our land.
  • Why did you come for me?
  • Those who enslaved you have taken over our land.
  • ... mountains of corpses will not stand in our way.
  • We believe you are the only one who can help us.
  • Their army is infinite, we are forty-seven. 
  • If we do this there is no coming back.
  • The enemy will be watching.
  • I know what you are. - You have no idea.
  • I am not afraid of you. - You should be. 
  • Your life belongs to us. - Then take it if you can.
  • Come on.

Если выписать все слова в столбик, их окажется 103. Исключив дубликаты, получим 69 слов. Эти операции легко выполнить с помощью макросов, а их результаты удобно представить в виде таблицы с указанием частоты встречаемости каждого слова в субтитрах (см. иллюстрацию). 

Обработка слов из субтитров в электронной таблице

Даже на таком примере мы видим, что наибольшую частоту имеют служебные слова, местоимения, вспомогательные глаголы и т.п.. В дальнейшем для таких слов следует завести отдельный лист в электронной таблице, чтобы сразу же исключать их из рассмотрения. В отдельный лист также следует заносить и хорошо знакомые вам знаменательные слова. А вот оставшиеся следует прорабатывать, обращая внимание на то, как они произносятся актёрами, в каких контекстах употребляются.

Работа с электронными таблицами требует известного навыка. С другой стороны, такая работа может этот навык и развить, что пригодится вам ещё не раз. Для тех, кто учится на программиста или работает в этой сфере, макросы не представляют особой сложности. Ну а если вы не владеете этим инструментом, и вам не к кому обратиться за помощью, в следующей заметке я расскажу о сервисе в Интернете, который не требует никаких специальных знаний.


Вам тоже есть что сказать на эту тему? Включайтесь в обсуждение, давайте ваши комментарии к статьям прямо на "Англоматике".
*
Интересная рассылка? Поделитесь с друзьями (используйте функцию "Переслать" в Вашем почтовом клиенте)


С уважением,

Алексей Anglomat 
Автор блога "Англоматика" http://anglomatika.ru/

В избранное