dadata что это такое

DaData.ru превращает гуиды в адреса и знает всех пацанов на раёне

DaData.ru — сервис автоматической проверки и исправления контактных данных (ФИО, адресов, телефонов, email, паспортов). Плюс javascript-виджет и API подсказок при вводе адреса, ФИО, организации и банковских реквизитов.

Район города по адресу

Человек пишет адрес, а Дадата определяет район города. Полезно для интернет-магазинов — посчитать стоимость доставки в зависимости от района или сегментировать базу клиентов по районам.

Работает для Москвы, Санкт-Петербурга и городов с населением больше 500 тысяч. В подсказках, файлах и через API стандартизации.

Адрес по правилам Почты России

По правилам Почты, если город — центр региона, то название региона в адресе на конверте не пишется (Новосибирская обл, г Новосибирск, ул Абаканская, д 21). А если город — центр района, то не пишется название района (Московская обл, Одинцовский р-н, г Одинцово, ул Ракетчиков).

Дадата умеет формировать адрес одной строкой по этим правилам в подсказках, файлах и через API стандартизации.

Абонентские ящики и адреса до востребования

Если в письме указан адрес до почтового отделения («до востребования» или номер абонентского ящика), то адресат его получит. Но доставку товара по такому адресу делать бессмысленно.

Дадата отличает эти адреса от всех остальных и отмечает биркой «До почтового отделения»:

Поиск адреса по коду ФИАС

Адрес в России состоит из десятка-другого полей. Хранить его в базе отдельными полями неудобно: многие CMS и движки интернет-магазинов не содержат нужных полей.

Хранить адрес одной строкой проще. Но тогда не получится сегментировать клиентскую базу по городам, определить геокоординаты, напечатать адрес на конверте как положено (отдельно город, отдельно улица-дом-квартира).

Хранить уникальный идентификатор удобно. Но покупателю и Почте России его не покажешь. Поэтому совсем хорошо хранить в базе идентификатор ФИАС улицы и превращать его в полноценный адрес по запросу. Дом, корпус-строение и квартиру лучше хранить отдельными полями, потому что не все квартиранты платят налоги в базе налоговой нет квартир и многих домов.

Ровно это и делает API Дадаты: возвращает адрес по коду ФИАС. Ищет до улицы включительно:

Бесплатно до 10 тысяч запросов в день.

Надеемся, что вам будет полезно что-то из перечисленного. Подключайтесь, пробуйте, задавайте вопросы в комментариях или на форуме!

Источник

Стоимость услуг

Годовая подписка

Большинство сервисов «Дадаты» доступны по подписке. Тарифы отличаются количеством запросов в сутки и полнотой данных.

Часть сервисов в подписку не входят.

Ваши собственные справочники

Вы можете подключить к «Дадате» собственный справочник:

Коробочная версия

Включает те же сервисы, что годовая подписка, но устанавливается на ваш сервер и не требует доступа в интернет. Подходит, если больше 1 млн запросов в день, или отдел безопасности запрещает использовать «облака». Подключается к любым корпоративным справочникам.

Часть сервисов в «коробку» не входят.

Стоимость

550 тыс. ₽ за адреса или 990 тыс. ₽ за все компоненты. Включает лицензию и обновления на 3 года.

Чтобы купить «коробку», пишите на info@dadata.ru

Сервисы, которые оплачиваются отдельно

Стандартизация

Автоматически проверяет, исправляет и обогащает контактные данные. Не входит в подписку и в «коробку». Оплачивается за каждый запрос.

Кроме API, работает через файлы

Стоимость

10 копеек за запись. Первые 100 записей — бесплатно.

Поиск дублей

Находит похожих и одинаковых клиентов, адреса, телефоны или компании. Объединяет и строит единую карточку клиента. Не входит в подписку и в «коробку».

Стоимость

1 копейка за запись.

Сравнение списков

Автоматически сравнивает списки и показывает результат в удобной excel-таблице. Не входит в подписку и в «коробку».

Стоимость

1 копейка за запись.

Корпоративный пакет

Обычно «Дадата» работает по оферте. Специально для компаний, которым это не подходит, мы создали корпоративный пакет услуг. В отличие от обычной подписки, он включает вообще все сервисы «Дадаты»:

Источник

«Подсказки»

Быстрый ввод адресов, компаний, банков, ФИО, email и ещё много чего

Дополнительная информация

Код ФИАС
f26b876b-6857-4951-b060-ec6559f04a9a

Часовой пояс
Московское время (UTC+3)

Район
Северное Медведково

Ближайшее метро
Бабушкинская (1.1 км)

Читайте также:  регистрация в нрс какие документы нужны

Код налоговой
7715

Уровень по ФИАС
9 (квартира)

Дополнительная информация

Генеральный директор
Чех Илья Игоревич

Учредители
Андрей Давидюк, Илья Чех,
Руслан Бабинцев, Василий Хлебников

ОКВЭД
72.19 (2014)
Научные исследования и разработки в области естественных и технических наук прочие

Налоговая инспекция
№ 46 по г. Москве (проезд Походный, д 3 стр 2)
код 7746

Финансы
Доходы 40 млн ₽, расходы 20 млн ₽, долгов и штрафов нет.

Количество сотрудников
18

Как это работает инструкция по настройке

Город, улица, дом, квартира
OpenStreetMap ID [[ address.fias_id ]]
Geoname ID [[ address.geoname_id ]]
Геокоординаты [[ geoLinkLabel ]] [[geoLinkDescription]]
Часовой пояс [[ address.timezone ]]
ISO-код [[ isoCodes ]]
Ближайшее метро
Геокоординаты [[ geoLinkLabel ]] [[geoLinkDescription]]
Часовой пояс [[ address.timezone ]]
ISO-код [[ isoCodes ]]
Уровень по ФИАС [[ fiasLevel ]]
Код ФИАС
Код КЛАДР [[ address.kladr_id ]]
Код ОКАТО [[ address.okato ]]
Код ОКТМО [[ address.oktmo ]]
Код ИФНС [[ address.tax_office ]]

Идентификаторы служб доставки:

СДЭК [[delivery.cdek_id]]
Boxberry [[delivery.boxberry_id]]
DPD [[delivery.dpd_id]]
Организация или ИП
Именительный: кто? [[ fio.result ]]
Родительный: кого? [[ fio.result_genitive ]]
Дательный: кому? [[ fio.result_dative ]]
Творительный: кем? [[ fio.result_ablative ]]

Падежи подключаются отдельно, через API стандартизации.

Именительный: кто? [[ fio.result ]]
Родительный: кого? [[ fio.result_genitive ]]
Дательный: кому? [[ fio.result_dative ]]
Творительный: кем? [[ fio.result_ablative ]]

Падежи подключаются отдельно, через API стандартизации.

Email
Справочник

10 тысяч запросов в день
≈ 300 введенных адресов

1 символ адреса = 1 запрос
ввести один адрес 10–30 запросов
ФИО, email, компанию или банк 10–20 запросов

«Подсказки» помогут ввести

Почтовый адрес

По России и всему миру. Без опечаток, с почтовым индексом, привязкой к ФИАС, районом города, метро и координатами.

Реквизиты компании и ИП

Название организации, адрес, ИНН, КПП, ОГРН, ОКВЭД, руководитель и прочее от налоговой

Без опечаток и с полом

Email

Название, ИНН, БИК, SWIFT, адрес и корр. счёт

И любые другие справочники

С чем работают «Подсказки»

и ещё 80 готовых модулей

Если вы разработчик — сделайте свой модуль по гайдлайну, чтобы получить бесплатный пиар в рассылке и соцсетях Дадаты

Онлайн-конструкторы интернет-магазинов и сайтов

Системы управления сайтами (CMS)

CRM и бизнес-приложения

Языки программирования и фреймворки

Если вы разработчик — сделайте свой модуль по гайдлайну, чтобы получить бесплатный пиар в рассылке и соцсетях Дадаты

Уже на 64 000 сайтов

«Подсказки» используют QIWI, OZON, KUPIVIP.RU, JOOM, METRO, ВсеИнструменты, ИЛЬ ДЕ БОТЭ, ЮМани, Росбанк и другие крупнейшие сайты Рунета.

Интернет-магазин косметики «ВсеЛаки»

До Дадаты было две проблемы:

Дадата помогла решить обе:

Курьерская служба «Аксиомус»

Подключили Подсказки. Раньше на ручную обработку отправлялась до 35% адресов по Москве и МО, теперь не более 15%.

Удобное, современное и настраиваемое API и подсказки, «живой» контакт с разработчиками.

OZON.ru

На форме заказа оставили одно поле для адреса и подключили подсказки «Дадаты». Конверсия в заказ выросла на 20%.

Источник

Как устроены адресные подсказки «Дадаты»

«Дадата» с 2014 года пилит «Подсказки». Они помогают быстро и без ошибок вводить контактные данные: адреса, реквизиты банков и компаний, емейлы — вот это все.

Штука устроена затейливо, и мы решили о ней рассказать. Возьмем подсказки по адресам, потому что они самые сложные.

Справочники и индексация

«Подсказки» знают, что подсказывать, потому что у них есть гигантские справочники. Хоть статья эта о подсказках по адресам, для пользы дела перечислю и другие справочники «Дадаты».

Искать что-то в неподготовленном справочнике — дело долгое и неблагодарное. Поэтому мы берем чудесную библиотеку Lucene и превращаем исходные данные в поисковый индекс.

Поисковый индекс — такой формат, при котором находить информацию можно оооочень быстро.

Физически индекс представляет из себя набор двух типов файлов:

Индекс и данные по адресам в сумме занимают 20 гигабайт. По компаниям примерно столько же, а остальные весят меньше.

Из официальных справочников для экономии убираем данные, по которым не ищем и которые не возвращаем. Также вычищаем дубли и очевидные ошибки. Например, в индексе по адресам нет:

Читайте также:  какой интервал между приемом лекарств

Поиск адекватных подсказок

«Подсказки» работают довольно заковыристо. Для простоты разобью процесс на этапы и расскажу о каждом подробнее. Если останутся вопросы, спрашивайте в комментариях.

1. Поехали: человек вводит символы в поле «Подсказок».

Каждый новый символ запускает серверный запрос с новыми параметрами. Частоту запросов можно подкрутить, об этом дальше

2. Плагин «Подсказок» собирает запрос. Между человеком и сервером трудится диспетчер — jQuery-плагин «Подсказок» (исходный код на GitHub).

Плагин принимает данные для поиска, упаковывает в запрос и передает на сервер.

От себя плагин добавляет, сколько адресов вернуть. Число задают как параметр при интеграции «Подсказок». Если количество не указали, «Подсказки» возвращают 10 результатов. Больше 20 просить бесполезно — вернутся только 20 вариантов.

Также плагин передает параметры фильтрации, их тоже задают при интеграции «Подсказок». Вот какие фильтры существуют:

А еще есть такая штука как geoboost. Похожа на ограничение по родителю, но влияет только на ранжирование адресов. Хотите, чтобы омские улицы стояли выше московских — пожалуйста.

«Яндекс.Деньги» по умолчанию предлагают улицы Москвы. Ограничение на город настраивают через параметры фильтрации «Подсказок»

По умолчанию в плагине включена геолокация: он передает на сервер местоположение пользователя. Это тоже параметр поиска.

При интеграции можно регулировать задержку запросов к серверу. Например, поставили задержку 100 миллисекунд. Если некий виртуоз за 100 миллисекунд вбил четыре символа, на сервер уйдет один запрос с четырьмя новыми символами. А не четыре запроса по одному.

Плагин работает в IE начиная с версии 10 и всех нормальных браузерах. Еще ему нужен jQuery 1.10+.

3. Проверяем кэш. Когда запрос приходит на сервер, «Подсказки» первым делом смотрят в кэш. Ищут там совпадение по всем параметрам запроса до единого.

Кэширование спасает от коротких запросов вроде «М», «Мо», «С». Таких однотипных комбинаций приходит колоссальное количество. Поскольку каждая буква — это отдельный запрос, кэширование защищает сервер от миллионов обращений к поисковому индексу.

Кэш целиком помещается в оперативной памяти, в нем лежит 100 000 результатов.

4. Ищем подходящие подсказки в индексе. Если в кэше ничего подходящего нет, «Подсказки» направляются в поисковый индекс.

«Подсказки» ищут адреса́ по:

Алгоритм подразумевает, что неполное или ошибочное в запросе только последнее слово. Если человек написал «Москва Турч», «Подсказки» ищут «Москва Турч*».

Запросы вроде «москв турч» не пройдут. Проблем это не создает, потому что люди набирают адреса́ последовательно, и «Подсказки» последовательно предлагают правильное написание каждой части а́дреса

Если в плагине отключили геолокацию, по запросам в 1-2 символа «Подсказки» ищут только регионы, муниципальные районы и города. Дома́ сервис ищет со второго слова в запросе.

Каждому результату «Подсказки» назначают вес. Вес нужен, потому что алгоритм порой находит тысячи вариантов, особенно для коротких запросов. А вернуть можно максимум 20 штук. Поэтому «Подсказки» сортируют результаты по весу и возвращают топовые.

Алгоритм ранжирования результатов — ноу-хау «Дадаты». Это такая серьезная штука, что описывать ее подробно я не могу: проклянут разработчики.

5. Сортируем результаты. Если у результатов поиска одинаковый вес, «Подсказки» их сортируют. Алгоритм сортировки тоже самописный, поэтому снова сохраняю таинственность.

6. Готовим ответ. Адреса, которые возвращают «Подсказки», по формату немного отличаются от ФИАС:

7. Кэшируем. Прежде чем вернуть результат, «Подсказки» кэшируют запрос со всеми параметрами и с ответом.

Кэш ограничен 100 000 записей по алгоритму LRU, поэтому сервис выкидывает оттуда редкие запросы. Популярные же вроде «Мо» висят в кэше вечно.

8. Плагин рисует подсказки. Он принимает ответ от сервера, показывает адреса́ на экране и подсвечивает совпадения. Если во время ввода нажать Enter, плагин сравнит текст с найденными подсказками и подставит в поле самую подходящую.

Источник

Стартап DaData помогает работать с клиентскими данными

ЦП: Елена, привет! Расскажите о себе немного, какой у вас профессиональный опыт и все такое.

ЦП: Ясно, а сейчас над каким проектом работаете?

Читайте также:  foundation app что это

ЦП: Расскажите поподробнее, что конкретно предлагаете, кому и какую проблему вообще решает этот сервис.

ЦП: То есть вы даете какой-то набор скриптов, которые надо поставить на сайт, и сразу появятся крутые и понятные формы, в которые пользователи ломанутся вписывать данные?

ЦП: А пример использования какой-то можете дать?

Или вот еще у нас будет скоро возможность определять временную зону для телефона, чтобы вам в 3 часа ночи не звонили из Москвы по вашему мобильнику или городскому.

ЦП: То есть чуть ли не по адресу почты вы можете узнать локейшн пользователя? Или как это все в совокупности работает?

Елена: По IP-адресу можно определять город, а дальше, когда он вводит улицу, уже показывать подсказки для его города.

ЦП: Просто хочется понять, вот я попал на какой-то сайт впервые в жизни. И на этом сайте стоят ваши скрипты. Мне они как-то помогут? И если, наоборот, это мой сайт, зачем мне что-то на него ставить?

Как стартапер и владелец магазина получаете больше информации о пользователе (доп. инфу), удобный ввод информации и, соответственно, большую вероятность того, что заполнят корректно вашу форму, что будут любить именно ваш магазин за удобство ввода. Кроме того, у владельца сайта пропадает необходимость все эти проверки и подсказки самому разрабатывать и тестировать их работу, обновлять версии справочников и поддерживать это все, фиксить ошибки. То есть, это еще один шаг к созданию удобных для пользователя сайтов.

ЦП: Понятно, круто. А расскажите, вы своими силами делаете проект? Я так понял, участвуют разработчики вашей первой компании? И откуда деньги на все?

Елена: Да, выделили небольшую команду, буквально пару человек, и делаем. Сам сайт нам делал SoftFacade, дизайном их очень довольны, реально ребята делают дизайн мирового уровня. Они сделали сайт, а поддерживаем уже мы. Для обеспечения бесперебойности подсказок, которые платные, используем облако в Amazon с 2 экземплярами сервиса и балансировкой между ними. Вот как раз на этой неделе разворачиваем под первого клиента.

ЦП: Ок, и сколько за такое сейчас готовы платить? Какие у вас цены?

Елена: Сейчас все бесплатно в рамках рекламной кампании до июня 2014, потом будет 10 копеек за запись при пакетной обработке. А подсказки можно будет подключить за 2800 рублей в год. Планы выбрали именно годовые, потому что бесплатно есть возможность пробовать сколько угодно, а платят наши заказчики именно за стабильность. Эти 2800 в основном первый год будут уходить на оплату нашей аренды на амазоне, потом если сервис станет популярным, мы уже начнем получать прибыль.

ЦП: Как вы вообще оцениваете этот рынок,какова его величина в России? Сколько вы хотите заработать на своем продукте?

ЦП: А как это все технически работает? Рокет саенс какой-то задействован?

ЦП: А насколько вообще, в итоге, ваш сервис помогает бизнесу, может быть, есть какие-то цифры? На сколько процентов увеличивается конверсия, снижается число отказов и т.п.

Елена: Проценты доставки по почтовым адресам точно растут, буквально несколько процентов недоставки остается. Ну и система сама размечает корректные-некорректные данные, а цифры уже зависят от конкретного источника данных, я думаю, мы их экспериментально скоро получим. Мы все-таки действительно стартап и находимся еще в поиске бизнес-модели, несмотря на наш солидный бэкграунд в области качества данных.

ЦП: Как вы, кстати, в плане того самого ФЗ-152 действуете, чтобы точно убедиться, что никаких нарушений нет?

ЦП: Про планы расскажите, может, зарубежная экспансия какая-то подразумевается?

Елена: Мы планируем в будущем подключить к своему сервису Украину с Казахстаном, а потом, если тема пойдет, добавлять новые страны. В принципе, есть контакты, так что теоретически существует возможность сделать DaData таким интернациональным местом обработки данных. Это одно из возможных направлений развития.

ЦП: Круто. Скажите, а какая у вас машина?

Елена: У мужа Мерседес Е-класса, а я езжу на такси, потому что плохо паркуюсь и бью машины :).

Источник

Сказочный портал