28 мая 2013-го

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

Об интровертах

Распространено мнение, что OpenStreetMap — проект для программистов, сисадминов, научных сотрудников, активистов открытых данных, но главное — для тех, кто не любит общаться с другими людьми и вообще выходить на улицу. На деле же именно такие люди чаще всего вредят проекту.

Например, serge56, блиставший два года назад. Типичный случай: приходит новичок (часто из аналогичных коммерческих проектов), быстро читает справочник Map Features, ставит JOSM и начинает фигачить-фигачить-фигачить. Окружающие мапперы смотрят на это и не понимают: как человек на снимках IRS разглядел дренажные канавы? Откуда взял номера домов для целого города? Двигает ли снимки под треки? Понятно, что иногда есть генплан, добытый в администрации, или детальный снимок, купленный у СканЭкса с требованием не распространять, но почему-то на вопрос «откуда дровишки» такие люди, неожиданно, распаляются, грозятся всё удалить, ругаются, изобретают неправдоподобные ответы, и в целом ведут себя неподобающе.

Причина понятна: они пришли в проект, увидели мощный редактор и справочник, провели параллели с прошлым проектом, и благодаря JOSM обрабатывают десятки квадратных километров в день. Но дело в том, что OpenStreetMap не похож ни на один другой картографический проект. Карта не важна. Главное — её качество. Нюансы критериев качества сложно понять, не интересуясь ими, а узнать, что ими нужно интересоваться, нельзя без участия в сообществе: чтения форума, как минимум. В итоге, тех, кто занимает первые строчки рейтингов, далеко не всегда рады там видеть.

Другой, но похожий, случай — подневольные мапперы. В каком-нибудь городе неизвестно откуда появляются все адреса на коряво нарисованных домиках — это таксисты установили на свои навигаторы OSM. Потлатчер перерезал в прах половину маршрутов общественного транспорта — это готовится транспортный портал. Поверх уже нарисованных границ вторым слоем добавили такие же, но неточные — отдел информатизации области нашёл подходящую базу геоданных. И так далее. С одной стороны, здорово, что OpenStreetMap втихую, в обход государственных геоданных мятущегося росреестра, проникает в муниципальные и частные организации. Вот только заставив людей изучать наши редакторы, почти невозможно побудить их выучить правила и общаться с сообществом. Когда мы замечаем «улучшения», нередко взятые с печатных карт («в каждом ларьке лежат, что такого?!»), уже поздно пить боржоми: как ни жаль, приходится всё стирать. Страдают все: и компании, потратившие десятки тысяч рублей и недели на загрузку данных, и участники OSM, теряющие ценный вклад, не всегда без ущерба для соседствующих объектов.

Программисты известны своим затворничеством. Это легко испытать на себе: взявшись за воплощение давно лелеемых планов, я почти перестал писать в штосм и общаться на форуме. И уже не в курсе современных схем тегирования. Открывая OpenStreetMap, технари в восторге: сотни гигабайт данных, которые можно вертеть как угодно! Схема тегов! Только почему-то не нормализованная, с десятком дублей. Почему бы не привести теги на объектах в порядок? Или взять массив GPS-треков, посчитать скорости и направления для каждого ребра и прописать их в какой-нибудь maxspeed:practical. Сообщество спасибо скажет!

Суть OSM — в хаосе, в изобретении собственных тегов, конкурирующих схемах, рисовании пучка железнодорожных путей одной или несколькими линиями, мерцающих статусных частях и мозолящих глаза landuse=military. Это не удобная база данных. У неё нет правильной формы. Любая автоматическая правка не добавит информации, но, скорее всего, потеряет её часть. И это я ещё не касаюсь импортов, которые в определённый момент так достали участников, что нынче для запуска любого робота требуется пройти чеклист из 13 пунктов — которые, впрочем, сводятся к одному. Общайтесь с сообществом. Но нет, программисты предпочитают обосновать для себя («это же простой скрипт, где здесь вред?») и запустить. Лишь потом выясняется, что в названиях тегов опечатки, значения скорости или этажности выписаны с 14 знаками после запятой, и все нечётные точки сдвинуты на полметра. И обнаруживает это не программист, уже переключившийся на другую интересную задачу, а участники сообщества месяцы спустя, когда откатить правки уже непросто.

Всего этого можно избежать. Надо лишь понять и заявить: нам не важна карта. Она — лишь побочный продукт. В OpenStreetMap главное — сообщество, и человек, у которого один пост в форуме на 10 нарисованных линий, нам ценнее человека с одним постом на 1000. Если вы не задаёте вопросы, вы поступаете неправильно и почти наверняка ломаете данные. Количество — критерий качества у коммерческих проектов, вроде Народных карт или Map Maker. В OSM критерии качества — это лицензионная чистота данных и диалог (начиная с осмысленных комментариев к ченджсетам). Нет того или другого — будьте готовы, что ваши данные кому-то не понравятся и будут удалены.

Конечно, описанных мапперов-затворников всего десятки, против тысяч нормальных участников. Но даже один человек может так сломать карту, что все остальные будут чинить месяцами. Например, участник Localknowledge по незнанию поменял в Петербурге некоторые oneway=yes на no, и следы этого вандализма мы вылавливаем уже долго, а один из пользователей, веря в OSM, схлопотал ощутимый штраф.

Положительные примеры в этих категориях встречаются, но нечасто. ShurikF так хорошо обрисовал снимки Bing, что вопросов не остаётся: что видно — то и на карте. При этом ни разу не написал на форум, что, конечно, плохо. Нельзя не вспомнить Рыбинск. Группа пользователей с префиксами «РГС» детализирует города в Беларуси, и сообщество, вроде, не против, хотя никто не знает, кто это. Автоматических правок на территории России не видно (если не считать робота, следящего за статусными частями улиц): программисты занимаются обработкой данных и интерфейсами. А на форуме каждый день появляются новички.

Мнения, высказанные на этом сайте, отражают точку зрения лично автора сайта и ничью больше: ни его бывших или настоящих работодателей, ни семьи и знакомых.