<?xml version="1.0" encoding="utf-8"?> 
<rss version="2.0"
  xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd"
  xmlns:atom="http://www.w3.org/2005/Atom">

<channel>

<title>ШТОСМ: заметки с тегом nominatim</title>
<link>https://shtosm.ru/tags/nominatim/</link>
<description>ШТОСМ</description>
<author>Илья Зверев</author>
<language>ru</language>
<generator>E2 (v3576; Aegea)</generator>

<itunes:owner>
<itunes:name>Илья Зверев</itunes:name>
<itunes:email></itunes:email>
</itunes:owner>
<itunes:subtitle>ШТОСМ</itunes:subtitle>
<itunes:image href="" />
<itunes:explicit></itunes:explicit>

<item>
<title>Савёловские Мнёвники на Кушелевке под Семково</title>
<guid isPermaLink="false">1545</guid>
<link>https://shtosm.ru/all/savyolovskiy/</link>
<pubDate>Wed, 03 Nov 2021 22:37:03 +0400</pubDate>
<author>Илья Зверев</author>
<comments>https://shtosm.ru/all/savyolovskiy/</comments>
<description>
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://shtosm.ru/pictures/savelovskiy_nominatim.jpg" width="1262" height="541" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;С этого дня поисковик Nominatim на главной osm.org по запросу «Савёловский» возвращает точно такие же результаты, как по «Савеловский», без «ё». Сара Хоффманн встроила в обработчик данных токенизатор ICU, благодаря которому взаимозаменяемые буквы можно заменять. Это требовало перезаливки данных в базу, которую приурочили к &lt;a href="https://nominatim.org/2021/11/03/release-40.html"&gt;выходу Nominatim 4.0.0&lt;/a&gt;.&lt;/p&gt;
&lt;p&gt;Действию, очевидному для любого, кто владеет русским языком, Nominatim просили научить &lt;a href="https://github.com/osm-search/Nominatim/issues/886"&gt;с 2018 года&lt;/a&gt;. Было два способа: воспользоваться новым токенизатором, добавленным в PostgreSQL за пару месяцев до просьбы, или поправить таблицу автозамены в Nominatim. Последнее K Rahul Reddy сделал слишком поздно: его пул-реквест &lt;a href="https://github.com/osm-search/Nominatim/pull/1714"&gt;отклонили&lt;/a&gt;, потому что таблицу планировали убрать.&lt;/p&gt;
&lt;p&gt;Русскоязычным сервисам было бы разумно забыть о номинатиме и воспользоваться альтернативными поисковыми движками: Pelias или Gazetteer. Не Photon — тот работает на данных Nominatim и пока различает эти буквы. К сожалению, размер имеет значение: несмотря на проблемы с поиском и сложный процесс установки, люди предпочитают пользоваться движками из списка &lt;i&gt;Top 1&lt;/i&gt;.&lt;/p&gt;
&lt;p&gt;В этом году разработка Nominatim набрала невиданную скорость: релизы выходили один за другим, а Саре постоянно находила что-то новое, о чём рассказать &lt;a href="https://www.youtube.com/watch?v=Q2Y2md2kh54"&gt;на конференциях&lt;/a&gt; или в &lt;a href="https://nominatim.org/blog/"&gt;блоге проекта&lt;/a&gt;. Причина — в деньгах. Движок останется открытым на 100%, но это не означает, что разработчики будут голодать. На сайте упомянуты несколько спонсоров — NLNet, OpenCage, GraphHopper, Komoot и другие. Судя по их количеству и по тому, что OSMF, &lt;a href="http://shtosm.ru/all/korrupciya-i-osm2pgsql/"&gt;чей грант&lt;/a&gt; запустил ускорение проекта, упомянут последним, денег там достаточно, чтобы Сара не занималась ничем другим. Это обнадёживает: может, скоро движок научится другим полезным эвристикам, типа учёта дефисов, пробелов и литер в номерах домов.&lt;/p&gt;
&lt;p&gt;Помимо замены самопального токенизатора на стандартный ICU от ассоциации Unicode, в четвёртой версии убрали скрипты командной строки на PHP в пользу единого инструмента на Python. Этот инструмент помогает во всём, от подготовки базы данных до её обновления и администрирования. То есть, кажется, теперь не нужно устанавливать PHP для подготовки данных. В &lt;a href="https://nominatim.org/release-docs/latest/"&gt;документации&lt;/a&gt; дописали большой раздел про настройку движка. И теперь можно подключить базу почтовых индексов для любой страны, а не только для США и Великобритании, как раньше.&lt;/p&gt;
</description>
</item>


</channel>
</rss>