Как сделать частотный словарь в excel?
Алгоритм работы
- Подготовить исходный текст так, чтобы в результате получить список слов, каждое из которых в новой строке (в Word)
- Перенести слова из Word в таблицу Excel
- Упорядочить столбец по алфавиту
- При необходимости удалить лишние строки
- Добавить ячейку в первой строке с текстом-названием, например, «Словарь»
- Выделить столбец и на его основе создать сводную таблицу на новом листе
- В полученной сводной таблице отобразить столбец с частотой слов
Get the Flash Player to see this player.
«
Текстовые формулы и способы их использования для обработки текстов с помощью таблиц Excel Создание простых тестов с помощью Excel
»
Описание первой версии
GIF
Инструмент Словарь строит частотный словарь униграмм по леммам и отображает их в порядке убывания частотности. Это значит что словарь у нас состоит из единичных слов. И это значит что не важно в какой словоформе встречено слово «удочка». Если найдены слова «удочка», «удочку»,»удочки» то количество леммы «удочка» в словаре увеличивается на 3. Таким образом мы видим как часто встречается то или иное слово в семантике причем в любой словоформе. Это удобно и наглядно. Для того чтобы построить словарь достаточно выделить столбец с запросами и нажать кнопку Словарь на ленте. Предполагается что пустых строк в семантике у нас нет, иначе словарь не будет построен.
Зачем это нужно
Этот инструмент создан для работы в паре с инструментом Выжимка.
Даже если семантика нам совершенно незнакома, например «удилища», мы все равно можем выделить слова и предлоги которые мешают нам при сортировке. В этом конкретном примере это слова «купить»,»удочка»,»метр»,»в»,»для»,»москва»,»рыбалка»,»с»,»интернет», «магазин», «цена». Для того чтобы лучше понять назначение словаря предлагаю ознакомиться с инструментом Выжимка
Что нового?
GIF
Начиная с версии 1.1.5 появились две новые кнопки. Кнопка Экспорт позволяет выгрузить данные словаря на отдельный лист. Говорят, что это нужно людям занимающимся контекстом. Как это работает видно на картинке слева. Кроме этого, теперь можно выбрать галочкой любой термин (или несколько) в словаре и закрасить ячейку содержащую термин цветом. После этого закрашенные ячейки можно, например, выбрать через стандартный фильтр по цвету и удалить. Кроме этого исправлена утечка памяти и словарь теперь не боится большого количества строк. Если в файле 100 000 строк словарь строится довольно быстро.
Как установить?
Инструмент Словарь это часть SEO-Excel