Задача: из исходного формата vic.pdf следует провести конвертирование в формат csv. Файл vic.pdf содержит таблицы, хранящиеся как изображения. Уже есть распознанный вариант, который следует откорректировать.
Требования:
1. Названия полей – только первая строка. 2. Название марки машины – первые два поля пустые, в третьей – название марки. 3. Название каждой марки машины только один раз – перед началом перечисления ее моделей. 4. Модель машины в первом поле, второе поле пустое. 5. Названия моделей машин не дублируются друг за другом. 6. Модификация модели состоит из двух первых полей. 7. Поле год: разделение идет также символом ~, как и в pdf. 8. Если поле пустое, никаких пробелов быть не должно. 9. В некоторых местах распознано строчными символами, несмотря на то, что в оригинале заглавными – писать как в оригинале. 10. Во втором поле временами встречаются символы японского языка: перевести. 11. Второе поле имеет структуру: name[(*)][{*}][ <*>][ (*)][(*)][(*)], где [ ] – не обязательное наличие, * - любой набор символов. {}, <>, () – используются в самом поле. Пробел не ставиться только перед {} и повторными (), а также () перед name – когда являются частью названия модификации модели (в оригинале не на японском). Если японские символы без скобок, то указывать следует их в скобках (в переведенном виде). 12. Название марок и моделей заглавными, за исключением случаев, когда в оригинальном файле используются строчные символы. 13. Поля фильтров могут состоять из нескольких пар. В этом случае следует разделять их тройкой символов « / » (пробел – слеш – пробел). 14. Убрать, везде где в оригинале отсутствуют лишние пробелы и символы подчеркивания. 15. В фильтрах не правильно распознаны буквы O как 0 (ноль) – исправлять (это касается и других символов). 16. Переводить марки машин с японского. 17. Переводить помечания во втором поле с японского ( размещая в () ). 18. Не переводить японские символы и различные значки в фильтрах - игнорировать. 19. Любой перевод с японского языка производиться на английский. 20. Файл должен хранить только символы английского алфавита. 21. Конечный формат файла – csv.
На выполнение дается 7 дней(раньше-поощрается) Кто заинтересован-пишите сумму за которую готовы взяться Каталог в pdf и частично готовый документ в xlsx
Задача: из исходного формата vic.pdf следует провести конвертирование в формат csv. Файл vic.pdf содержит таблицы, хранящиеся как изображения. Уже есть распознанный вариант, который следует откорректировать.
Требования:
1. Названия полей – только первая строка. 2. Название марки машины – первые два поля пустые, в третьей – название марки. 3. Название каждой марки машины только один раз – перед началом перечисления ее моделей. 4. Модель машины в первом поле, второе поле пустое. 5. Названия моделей машин не дублируются друг за другом. 6. Модификация модели состоит из двух первых полей. 7. Поле год: разделение идет также символом ~, как и в pdf. 8. Если поле пустое, никаких пробелов быть не должно. 9. В некоторых местах распознано строчными символами, несмотря на то, что в оригинале заглавными – писать как в оригинале. 10. Во втором поле временами встречаются символы японского языка: перевести. 11. Второе поле имеет структуру: name[(*)][{*}][ <*>][ (*)][(*)][(*)], где [ ] – не обязательное наличие, * - любой набор символов. {}, <>, () – используются в самом поле. Пробел не ставиться только перед {} и повторными (), а также () перед name – когда являются частью названия модификации модели (в оригинале не на японском). Если японские символы без скобок, то указывать следует их в скобках (в переведенном виде). 12. Название марок и моделей заглавными, за исключением случаев, когда в оригинальном файле используются строчные символы. 13. Поля фильтров могут состоять из нескольких пар. В этом случае следует разделять их тройкой символов « / » (пробел – слеш – пробел). 14. Убрать, везде где в оригинале отсутствуют лишние пробелы и символы подчеркивания. 15. В фильтрах не правильно распознаны буквы O как 0 (ноль) – исправлять (это касается и других символов). 16. Переводить марки машин с японского. 17. Переводить помечания во втором поле с японского ( размещая в () ). 18. Не переводить японские символы и различные значки в фильтрах - игнорировать. 19. Любой перевод с японского языка производиться на английский. 20. Файл должен хранить только символы английского алфавита. 21. Конечный формат файла – csv.
На выполнение дается 7 дней(раньше-поощрается) Кто заинтересован-пишите сумму за которую готовы взяться Каталог в pdf и частично готовый документ в xlsx