Добрый день. Есть таблица, где в колонке A записаны фразы, а в колонке B числовые значения. В колонке A нет полных дублей, но при этом есть дубли «не явные», которые и необходимо определить. Под не явными дублями подразумевается, что в первой ячейке может быть фраза «купить яблоко», во второй «яблоко купить», необходимо найти все такие дубли и просуммировать для них значения из колонки B. Какая именно из фраз останется, а какая будет удалена — не принципиально. В примере цветом выделил дублирующиеся фразы. Подскажите, как можно решить эту проблему?
Добрый день. Есть таблица, где в колонке A записаны фразы, а в колонке B числовые значения. В колонке A нет полных дублей, но при этом есть дубли «не явные», которые и необходимо определить. Под не явными дублями подразумевается, что в первой ячейке может быть фраза «купить яблоко», во второй «яблоко купить», необходимо найти все такие дубли и просуммировать для них значения из колонки B. Какая именно из фраз останется, а какая будет удалена — не принципиально. В примере цветом выделил дублирующиеся фразы. Подскажите, как можно решить эту проблему?Bakalov
данные не пробовали одноформатно собирать, делать, загружать, выгружать, проводить обучение по заполнению данных с людьми которые заполняют. И все океюшки будет. Не даром же существуют форматы и стандарты в заполнении бланков в каких-то ни было организациях, чтобы потом сотрудники не парили мозги себе лишней ручной работой. Мне кажется это самое лучшее решение всех проблем связанных с разноформатными данными - это создание форматов.
данные не пробовали одноформатно собирать, делать, загружать, выгружать, проводить обучение по заполнению данных с людьми которые заполняют. И все океюшки будет. Не даром же существуют форматы и стандарты в заполнении бланков в каких-то ни было организациях, чтобы потом сотрудники не парили мозги себе лишней ручной работой. Мне кажется это самое лучшее решение всех проблем связанных с разноформатными данными - это создание форматов.AVP
Сообщение отредактировал AVP - Среда, 16.04.2014, 09:47
Я-то имел в виду FindBestMatchTxt(). ИМХО под такие задачи подходит больше, и работает пошустрее. Кстати выловил мелкий баг, в последней выложенной версии не работало исключение искомой строки, если она в списке поиска. Здесь поправил. В готовые решения пока не перезалил.
Я-то имел в виду FindBestMatchTxt(). ИМХО под такие задачи подходит больше, и работает пошустрее. Кстати выловил мелкий баг, в последней выложенной версии не работало исключение искомой строки, если она в списке поиска. Здесь поправил. В готовые решения пока не перезалил.Формуляр