Всем привет. Я занимаюсь контекстной рекламой. Обрабатываю ключевые слова для рекламных компаний. В связи с этим стоит задача, объединить из столбца в одну ячейку, через запятую, все однокоренные/однотипные слова (слова с одинаковым корнем, но разных частей речи).
Не пойму как можно решить эту задачу и поэтому хочу посоветоваться с участниками форума.
Сначала я пытался определять однокоренные/однотипные слова, с помощью отсчитывания нескольких символов от начала слова. Но этот способ не лучшее решение, потому что довольно часто, как однотипные определяются слова, никак не связанные с изначально заданным словом.
Например, нужно определить все слова, так или иначе, связанные со словом «мода». Для того делаем макрос который отсчитывает 3 символа от начала слова, т.е. «мод»
Но при этом условии, помимо однокоренных/однотипных слов: - модные - мода - моды - модой
Также определяются, как однотипные слова, никак не связанные с изначально заданным словом: - модернизация - моделирование - модерн - модификация
У меня есть мнение, может подключаться к каким-то словарям, но не понятно как это сделать и реально ли это реализовать?
Как лучше решить эту задачу? Как настроить корректное определение однокоренных/однотипных слов?
Заранее благодарю за ответы.
Всем привет. Я занимаюсь контекстной рекламой. Обрабатываю ключевые слова для рекламных компаний. В связи с этим стоит задача, объединить из столбца в одну ячейку, через запятую, все однокоренные/однотипные слова (слова с одинаковым корнем, но разных частей речи).
Не пойму как можно решить эту задачу и поэтому хочу посоветоваться с участниками форума.
Сначала я пытался определять однокоренные/однотипные слова, с помощью отсчитывания нескольких символов от начала слова. Но этот способ не лучшее решение, потому что довольно часто, как однотипные определяются слова, никак не связанные с изначально заданным словом.
Например, нужно определить все слова, так или иначе, связанные со словом «мода». Для того делаем макрос который отсчитывает 3 символа от начала слова, т.е. «мод»
Но при этом условии, помимо однокоренных/однотипных слов: - модные - мода - моды - модой
Также определяются, как однотипные слова, никак не связанные с изначально заданным словом: - модернизация - моделирование - модерн - модификация
Мне кажется, что надо задавать не один корень, а все похожие и делать выборку слов учитывая весь набор похожих корней. Например в в ячейках столбца А похожие корни; мод, модерн и тд. Тогда из списка в столбце В можно отобрать в разные столбцы слова с разными корнями.
Мне кажется, что надо задавать не один корень, а все похожие и делать выборку слов учитывая весь набор похожих корней. Например в в ячейках столбца А похожие корни; мод, модерн и тд. Тогда из списка в столбце В можно отобрать в разные столбцы слова с разными корнями.AlexM
Номер мобильного модема (без голосовой связи) 9269171249 МегаФон, Московский регион.
гуглофобам на заметку: поиск по словосочетанию "поиск однокоренных слов" даёт вполне приличные результаты.
Вопрос от ни разу неграмотных: где Word "спрятал" этот замечательный штатный режим - "поиск однокоренных слов"? Я на полном серьёзе: я в Word - почти профан.
Цитата (ikki)
гуглофобам на заметку: поиск по словосочетанию "поиск однокоренных слов" даёт вполне приличные результаты.
Вопрос от ни разу неграмотных: где Word "спрятал" этот замечательный штатный режим - "поиск однокоренных слов"? Я на полном серьёзе: я в Word - почти профан.Матрёна
Уточню задачу, для которой это делается. В столбце идут сотни и тысячи слов. И нужно быстро обнаружить одинаковые слова (даже в разных склонениях, падежах и т.д.)
Задавать корни в ручную видится слишком трудоемкой и медленной работой. Работа должна выполняться быстро.
Видится мне такой вариант решения задачи: проставлять одинаковые цифры около каждого однокоренного/однотипного слова. Получается не очень быстро, но зато 100% надежно для последующей фильтрации одинаковых слов.
Есть идеи как ускорить этот процесс? Или это максимум что можно автоматизировать?
Уточню задачу, для которой это делается. В столбце идут сотни и тысячи слов. И нужно быстро обнаружить одинаковые слова (даже в разных склонениях, падежах и т.д.)
Задавать корни в ручную видится слишком трудоемкой и медленной работой. Работа должна выполняться быстро.
Видится мне такой вариант решения задачи: проставлять одинаковые цифры около каждого однокоренного/однотипного слова. Получается не очень быстро, но зато 100% надежно для последующей фильтрации одинаковых слов.
Метод кодировки в ситуации безысходки - самый надежный вариант. "Тихой сапой, медленно, но верно" всегда получишь желаемое! Лично я - за новые варианты поиска!
Метод кодировки в ситуации безысходки - самый надежный вариант. "Тихой сапой, медленно, но верно" всегда получишь желаемое! Лично я - за новые варианты поиска!Матрёна
Я занимаюсь контекстной рекламой. Обрабатываю ключевые слова для рекламных компаний.
я не занимаюсь контекстной рекламой. но подозреваю, что для подобных задач имеется что-то более специализированное, нежели Excel. а у гугла вообще стопицсот патентов на эту тему - например, как понять, какой именно "Линкольн" имеет в виду человек - автомобиль или президента
Цитата (rownong27)
Я занимаюсь контекстной рекламой. Обрабатываю ключевые слова для рекламных компаний.
я не занимаюсь контекстной рекламой. но подозреваю, что для подобных задач имеется что-то более специализированное, нежели Excel. а у гугла вообще стопицсот патентов на эту тему - например, как понять, какой именно "Линкольн" имеет в виду человек - автомобиль или президента ikki
помощь по Excel и VBA ikki@fxmail.ru, icq 592842413, skype alex.ikki
проставлять одинаковые цифры около каждого однокоренного/однотипного слова А как Вы это собрались делать, если мода и модернизация у Вас попадают в одну категорию?
ЗЫ Можно было бы идти от большего к меньшему (сначала модернизация, потом мода), но где гарантия что они будут идти по порядку?
Я имел в виду в ручную цифры проставлять
Цитата (Serge_007)
проставлять одинаковые цифры около каждого однокоренного/однотипного слова А как Вы это собрались делать, если мода и модернизация у Вас попадают в одну категорию?
ЗЫ Можно было бы идти от большего к меньшему (сначала модернизация, потом мода), но где гарантия что они будут идти по порядку?
я не занимаюсь контекстной рекламой. но подозреваю, что для подобных задач имеется что-то более специализированное, нежели Excel.
Есть сервис для подбора ключевых слов http://wordstat.yandex.ru/ но там все вместе и целевые ключевые слова и не целевые. Вот и ищу способы быстрого отбора целевых. Специализированный софт есть у яндекса "Директ Коммандер" и загрузка Excel через форму на сайте , у гугла "гугл эдитор"/ Но в эти программы и сервисы нужно загружать у же готовый массив данных, чтобы они опубликовали его в показы по указанным ключеым словам. Там нет функций отбора ключевых слов. И как уже говорил, вот и ищу способы быстрого отбора целевых слов.
Цитата (ikki)
я не занимаюсь контекстной рекламой. но подозреваю, что для подобных задач имеется что-то более специализированное, нежели Excel.
Есть сервис для подбора ключевых слов http://wordstat.yandex.ru/ но там все вместе и целевые ключевые слова и не целевые. Вот и ищу способы быстрого отбора целевых. Специализированный софт есть у яндекса "Директ Коммандер" и загрузка Excel через форму на сайте , у гугла "гугл эдитор"/ Но в эти программы и сервисы нужно загружать у же готовый массив данных, чтобы они опубликовали его в показы по указанным ключеым словам. Там нет функций отбора ключевых слов. И как уже говорил, вот и ищу способы быстрого отбора целевых слов.rownong27
Ну, в какой-то степени можно облегчить задачу с помощью нечёткого сравнения строк Сперва, сортируем по рейтингу сходства с заданной строкой, а дальше - ручками, ручками...
Ну, в какой-то степени можно облегчить задачу с помощью нечёткого сравнения строк Сперва, сортируем по рейтингу сходства с заданной строкой, а дальше - ручками, ручками...Формуляр