Есть список текстовых разношерстных данных, в которых встречаются адреса. Есть база улиц города.
Сейчас удается определить, что название улицы встречается в ячейке с текстом, но я не знаю, как еще вытащить из этого текста номер дома, который идет после названия улицы.
Прикладываю файл с примером.
Нужно:
1. Полностью вытащить адрес из текста (название улицы и номер дома/корпуса) 2. Осуществить поиск по этому же тексту на предмет указания цены в руб. Определить что это цена можно по словам: р. / р / руб. / руб ии по наличию трех значного числа в тексте не более 500. Если это стоимость, то она не может быть менее 50 руб, она всегда округлена, либо до 50 либо до 0, т.е. цены 230 рублей – быть не может, значит это какая то левая цифра.
Эти данные нужны мне в разных ячейках. Файл прикладываю к заданию.
Бюджет на задачу 500 руб.
Есть список текстовых разношерстных данных, в которых встречаются адреса. Есть база улиц города.
Сейчас удается определить, что название улицы встречается в ячейке с текстом, но я не знаю, как еще вытащить из этого текста номер дома, который идет после названия улицы.
Прикладываю файл с примером.
Нужно:
1. Полностью вытащить адрес из текста (название улицы и номер дома/корпуса) 2. Осуществить поиск по этому же тексту на предмет указания цены в руб. Определить что это цена можно по словам: р. / р / руб. / руб ии по наличию трех значного числа в тексте не более 500. Если это стоимость, то она не может быть менее 50 руб, она всегда округлена, либо до 50 либо до 0, т.е. цены 230 рублей – быть не может, значит это какая то левая цифра.
Эти данные нужны мне в разных ячейках. Файл прикладываю к заданию.