Лет 5 назад нам зачем-то понадобилась база яндекс справочника, они же яндекс карты. Основное отличие от нашей базы, что мы взяли только организации с сайтам и добавили им параметры на основании домена: Яндекс Х и дату регистрации домена.
Приходилось использовать несколько методов по сбору списка организаций, т.к. ни один не давал полный список конечных урл организаций. В сумме мы оцениваем собранную базу как 99% от опубликованных в базе яндекса. Без учета того, что в итоге мы выбросили те, что без сайта.
Далее ролик как выглядит база и как ей пользоваться на примере всех компаний Москвы и МО.
Если вы работаете на нашем любимом движке Webasyst, то любую подборку мы вам сконфигурируем максимально дешево.