Дата: Понедельник, 10.02.2014, 01:50 |
Сообщение № 1
Группа: Гости
Всем доброго времени! У меня есть такой вопрос: Есть около 1000 строк в столбце (например А), в каждой строке- текст(от 2 до 5 слов)
Пример: 1) В предложении пять слов 2) Пять слов в предложении 3) Предложение из пяти слов Вопрос в Нужно удалить из столбца строки - "дублируюшие" друг друга. Не просто 100% копии но и те строки в которых разный порядок слов как в строках 1 и 2. Желательно и удалять разные словоформы. Например (слов , слова , слово)
Возможно ли такое? Я не профи но может это поможет: Строки можно разбить на отдельные слова по столицам и как то сравнивать их. Читал на форуме что строки можно сравнивать в % по похожести друг на друга. Если это реально то в столбце левее (например можно выводить номера строк в которых содержатся похожие значения.
Спасибо, буду ждать ответа))
Всем доброго времени! У меня есть такой вопрос: Есть около 1000 строк в столбце (например А), в каждой строке- текст(от 2 до 5 слов)
Пример: 1) В предложении пять слов 2) Пять слов в предложении 3) Предложение из пяти слов Вопрос в Нужно удалить из столбца строки - "дублируюшие" друг друга. Не просто 100% копии но и те строки в которых разный порядок слов как в строках 1 и 2. Желательно и удалять разные словоформы. Например (слов , слова , слово)
Возможно ли такое? Я не профи но может это поможет: Строки можно разбить на отдельные слова по столицам и как то сравнивать их. Читал на форуме что строки можно сравнивать в % по похожести друг на друга. Если это реально то в столбце левее (например можно выводить номера строк в которых содержатся похожие значения.
Есть такая у меня функция.Результаты ее работы. Главное подобрать правильный порог процента совпадения для отбраковки в зависимости от длинны фразы. [vba]
Код
Фраза1 Фраза2 % совпадения В предложении пять слов Пять слов в предложении 1 В предложении пять слов Предложение из пяти слов 0,87804878 Пять слов в предложении Предложение из пяти слов 0,87804878 shanti vikttur 0,307692308 shanti doober 0 vikttur doober 0,153846154
[/vba]
Есть такая у меня функция.Результаты ее работы. Главное подобрать правильный порог процента совпадения для отбраковки в зависимости от длинны фразы. [vba]
Код
Фраза1 Фраза2 % совпадения В предложении пять слов Пять слов в предложении 1 В предложении пять слов Предложение из пяти слов 0,87804878 Пять слов в предложении Предложение из пяти слов 0,87804878 shanti vikttur 0,307692308 shanti doober 0 vikttur doober 0,153846154
Есть такая у меня функция.Результаты ее работы. Главное подобрать правильный порог процента совпадения для отбраковки в зависимости от длинны фразы.
Фраза1 Фраза2 % совпадения В предложении пять слов Пять слов в предложении 1 В предложении пять слов Предложение из пяти слов 0,87804878 Пять слов в предложении Предложение из пяти слов 0,87804878 shanti vikttur 0,307692308 shanti doober 0 vikttur doober 0,153846154
А реально ли сделать чтобы работало как в описанном примере ?
Есть такая у меня функция.Результаты ее работы. Главное подобрать правильный порог процента совпадения для отбраковки в зависимости от длинны фразы.
Фраза1 Фраза2 % совпадения В предложении пять слов Пять слов в предложении 1 В предложении пять слов Предложение из пяти слов 0,87804878 Пять слов в предложении Предложение из пяти слов 0,87804878 shanti vikttur 0,307692308 shanti doober 0 vikttur doober 0,153846154
А реально ли сделать чтобы работало как в описанном примере ?shanti
Здравствуйте! У меня похожая проблема, только немного проще — некоторые предложения обрезаны. В столбце А: Сей пшеницу на Симона Зилота - родится, аки золото (западн В столбце B где-то из 80 тысяч строк есть полная версия пословицы: Сей пшеницу на Симона Зилота - родится, аки золото (западн.). Надо проверить каждую строчку в столбце A (80 тысяч строк) и найти полную версию предложения в столбце B и указать ее в столбце C. Установил Fuzzy Lookup, но он не появился в надстройках
Оплата по WebMoney, QIWI или Яндекс.Деньги.
Здравствуйте! У меня похожая проблема, только немного проще — некоторые предложения обрезаны. В столбце А: Сей пшеницу на Симона Зилота - родится, аки золото (западн В столбце B где-то из 80 тысяч строк есть полная версия пословицы: Сей пшеницу на Симона Зилота - родится, аки золото (западн.). Надо проверить каждую строчку в столбце A (80 тысяч строк) и найти полную версию предложения в столбце B и указать ее в столбце C. Установил Fuzzy Lookup, но он не появился в надстройках
Оплата по WebMoney, QIWI или Яндекс.Деньги.altblog