Разбор почтовых адресов

 
 страна:
 субъект:
 регион:
 город:
 район города:
 улица:
 дом:
 квартира:
 почтовый индекс:
 GUID элемента ФИАС:
 код ФИАС:
 код КЛАДР:

 Например: Спб, Марш. Жукова, 44 128 - синоним "Спб" для Санкт-Петербург, сокращение "Марш."
Арзамас-16, Репина, д.1, кв. 34 - история переименований городов
Спб, Салтыкова-щедрина, 44 128 - история переименования улиц
Московская обл., г. Ногинск-9, ул. Юбилейная, д.4, кв. 34 - исправление типа элемента - "пгт" вместо "г"
ул Xоламская , 3 - восстановление пропущеных элементов
москва, льва толсотого , 12 - исправление опечаток
балашиа, некраова 4 59 - исправление опечаток
г москва ,пр 60 лет октября, , , 23/-137 - распознавание варианта написания

RCO Address Parser 3.0 (RCO AP3) предназначен для разбора и нормализации российских и иностранных почтовых адресов.

Для адресов РФ реализованы сопоставление с классификатором ФИАС, представление строки адреса в унифицированном виде, выдача списка подсказок-вариантов для продолжения адреса. Поддерживаются также адреса мест рождения, включая адреса СССР.

Входными данными является текстовая строка с адресом или набор полей с адресными элементами, передаваемые по SOAP протоколу. Входные данные разбираются, и структурированный результат разбора адреса возвращается в виде json, внутри SOAP ответа.

На входные данные для разбора накладываются следующие ограничения:

  • адреса РФ и СССР следует задавать на русском языке;
  • иностранные адреса могут задаваться кириллическими и латинскими символами.

Для достижения максимального качества разбора адресной строки желательно руководствоваться следующими правилами:

  • разделять адресные элементы запятой «,»;
  • соблюдать прямой порядок следования элементов.

Архитектура обеспечивает работу RCO AP3 без использования СУБД. Если пользовательское приложение работает с СУБД Oracle, то оно может использовать пакеты, входящий в состав поставки, облегчающие обмен данными c RCO AP3.

RCO AP3 позволяет обрабатывать как структурированные, так и неструктурированные адреса. Существует возможность настройки коррекции строки адреса перед началом обработки. Словари для распознавания адресов включают в себя места рождения СССР, правила разбора строки помещения.

Для определения принадлежности адреса иностранным государствам модуль разбора адресов загружает краткий справочник стран и городов мира.

Корректный запрос к модулю разбора должен содержать хотя бы один из следующих элементов:

  • GUID ФИАС адресного элемента (города/улицы) или дома;
  • Код ФИАС адресного элемента;
  • Не пустая адресная строка;
  • Набор типизированных полей адреса.

Скорость обработки адресов в секунду — от 50 (при поиске по строке) до 200 адресов при поиске по типизированным полям.

Устраняемые виды ошибок/опечаток во входных данных:

  • опечатки («ул Перера» исправит на «ул Перерва»);
  • пропуск ключевых слов (ул., г. и т.п.) в элементах адреса;
  • неполнота задания адреса (при условии уникальности заданных элементов, например, адрес «ул Xоламская , 31» преобразует в «индекс 361823, респ Кабардино-Балкарская, р-н Черекский, с Герпегеж, ул Холамская, дом 31»);
  • преобразование римских цифр в арабские;
  • использование старых названий городов и улиц, например, «Арзамас-16, Репина, д.1, кв. 34» преобразует в «индекс 607188, обл Нижегородская, г Саров, ул Репина, дом 1, кв. 34»;
  • автозамена часто встречающихся устойчивых сокращений («проф.» вместо «профессора», «ак.» вместо «академика» и т.д.).

Подробная информация о возможностях RCO AP3 находится в Руководстве разработчика.

Аппаратные требования:

  • 64-разрядный процессор (одно ядро);
  • 4 Гб оперативной памяти (для обновления баз ФИАС 12 Гб);
  • 1,7 Гб HDD (для обновления баз ФИАС 50Гб);
  • сетевая карта;

Программные требования:

  • 64-битная операционная система Windows 7,8,10; Windows Server 2008 или выше;
  • для Web-приложения — IIS 6.0 или выше;
  • для использования совместно с Oracle — Oracle Database не ниже 12 версии.


e-mail: info@rco.ru
© 2024 www.rco.ru