Борьба за частоту
Интерфакс опубликовал список самых популярных названий улиц. AMDmi3 полтора месяца назад выкладывал аналогичный рейтинг по России — правда, только для регионов, обрабатываемых его ботом для нормализации названий. Интересно сравнить эти два списка. Вот первый (в скобках — позиция улицы во втором):
- Центральная (19)
- Молодёжная (21)
- Школьная (18)
- Лесная (25)
- Садовая (13)
- Советская (2)
- Новая (34)
- Набережная (24)
- Заречная (64)
- Зелёная (42)
Обрабатывается вся Россия. Благодаря Котяре, теперь и Беларусь, но статистика только по России.
У меня, помимо собственно улиц, названия собираются ещё и из addr:street, и надо думать, наибольший вклад вносят как раз адреса, поэтому по ссылке что-то вроде веса каждого названия.
Но если подсчитать только name вот что получится: http://pastebin.com/Gf0AkB6F Это уже сегменты, но от первого списка почти не отличается. ФНС же, очевидно, считает просто по КЛАДР.