15 заметок с тегом

ВНЕЗАПНО

Ctrl + ↑ Позднее
2013   ВНЕЗАПНО

Об интровертах

Распространено мнение, что OpenStreetMap — проект для программистов, сисадминов, научных сотрудников, активистов открытых данных, но главное — для тех, кто не любит общаться с другими людьми и вообще выходить на улицу. На деле же именно такие люди чаще всего вредят проекту.

Например, serge56, блиставший два года назад. Типичный случай: приходит новичок (часто из аналогичных коммерческих проектов), быстро читает справочник Map Features, ставит JOSM и начинает фигачить-фигачить-фигачить. Окружающие мапперы смотрят на это и не понимают: как человек на снимках IRS разглядел дренажные канавы? Откуда взял номера домов для целого города? Двигает ли снимки под треки? Понятно, что иногда есть генплан, добытый в администрации, или детальный снимок, купленный у СканЭкса с требованием не распространять, но почему-то на вопрос «откуда дровишки» такие люди, неожиданно, распаляются, грозятся всё удалить, ругаются, изобретают неправдоподобные ответы, и в целом ведут себя неподобающе.

Причина понятна: они пришли в проект, увидели мощный редактор и справочник, провели параллели с прошлым проектом, и благодаря JOSM обрабатывают десятки квадратных километров в день. Но дело в том, что OpenStreetMap не похож ни на один другой картографический проект. Карта не важна. Главное — её качество. Нюансы критериев качества сложно понять, не интересуясь ими, а узнать, что ими нужно интересоваться, нельзя без участия в сообществе: чтения форума, как минимум. В итоге, тех, кто занимает первые строчки рейтингов, далеко не всегда рады там видеть.

Другой, но похожий, случай — подневольные мапперы. В каком-нибудь городе неизвестно откуда появляются все адреса на коряво нарисованных домиках — это таксисты установили на свои навигаторы OSM. Потлатчер перерезал в прах половину маршрутов общественного транспорта — это готовится транспортный портал. Поверх уже нарисованных границ вторым слоем добавили такие же, но неточные — отдел информатизации области нашёл подходящую базу геоданных. И так далее. С одной стороны, здорово, что OpenStreetMap втихую, в обход государственных геоданных мятущегося росреестра, проникает в муниципальные и частные организации. Вот только заставив людей изучать наши редакторы, почти невозможно побудить их выучить правила и общаться с сообществом. Когда мы замечаем «улучшения», нередко взятые с печатных карт («в каждом ларьке лежат, что такого?!»), уже поздно пить боржоми: как ни жаль, приходится всё стирать. Страдают все: и компании, потратившие десятки тысяч рублей и недели на загрузку данных, и участники OSM, теряющие ценный вклад, не всегда без ущерба для соседствующих объектов.

Программисты известны своим затворничеством. Это легко испытать на себе: взявшись за воплощение давно лелеемых планов, я почти перестал писать в штосм и общаться на форуме. И уже не в курсе современных схем тегирования. Открывая OpenStreetMap, технари в восторге: сотни гигабайт данных, которые можно вертеть как угодно! Схема тегов! Только почему-то не нормализованная, с десятком дублей. Почему бы не привести теги на объектах в порядок? Или взять массив GPS-треков, посчитать скорости и направления для каждого ребра и прописать их в какой-нибудь maxspeed:practical. Сообщество спасибо скажет!

Суть OSM — в хаосе, в изобретении собственных тегов, конкурирующих схемах, рисовании пучка железнодорожных путей одной или несколькими линиями, мерцающих статусных частях и мозолящих глаза landuse=military. Это не удобная база данных. У неё нет правильной формы. Любая автоматическая правка не добавит информации, но, скорее всего, потеряет её часть. И это я ещё не касаюсь импортов, которые в определённый момент так достали участников, что нынче для запуска любого робота требуется пройти чеклист из 13 пунктов — которые, впрочем, сводятся к одному. Общайтесь с сообществом. Но нет, программисты предпочитают обосновать для себя («это же простой скрипт, где здесь вред?») и запустить. Лишь потом выясняется, что в названиях тегов опечатки, значения скорости или этажности выписаны с 14 знаками после запятой, и все нечётные точки сдвинуты на полметра. И обнаруживает это не программист, уже переключившийся на другую интересную задачу, а участники сообщества месяцы спустя, когда откатить правки уже непросто.

Всего этого можно избежать. Надо лишь понять и заявить: нам не важна карта. Она — лишь побочный продукт. В OpenStreetMap главное — сообщество, и человек, у которого один пост в форуме на 10 нарисованных линий, нам ценнее человека с одним постом на 1000. Если вы не задаёте вопросы, вы поступаете неправильно и почти наверняка ломаете данные. Количество — критерий качества у коммерческих проектов, вроде Народных карт или Map Maker. В OSM критерии качества — это лицензионная чистота данных и диалог (начиная с осмысленных комментариев к ченджсетам). Нет того или другого — будьте готовы, что ваши данные кому-то не понравятся и будут удалены.

Конечно, описанных мапперов-затворников всего десятки, против тысяч нормальных участников. Но даже один человек может так сломать карту, что все остальные будут чинить месяцами. Например, участник Localknowledge по незнанию поменял в Петербурге некоторые oneway=yes на no, и следы этого вандализма мы вылавливаем уже долго, а один из пользователей, веря в OSM, схлопотал ощутимый штраф.

Положительные примеры в этих категориях встречаются, но нечасто. ShurikF так хорошо обрисовал снимки Bing, что вопросов не остаётся: что видно — то и на карте. При этом ни разу не написал на форум, что, конечно, плохо. Нельзя не вспомнить Рыбинск. Группа пользователей с префиксами «РГС» детализирует города в Беларуси, и сообщество, вроде, не против, хотя никто не знает, кто это. Автоматических правок на территории России не видно (если не считать робота, следящего за статусными частями улиц): программисты занимаются обработкой данных и интерфейсами. А на форуме каждый день появляются новички.

2013   ВНЕЗАПНО

И вообще

Может, не так плохо рисовать «на дядю», а не в открытом проекте? Одна из наших целей — дать карту самых удалённых уголков каждому. Нарисовал я, значит, деревню на OSM, и кто её увидит? Не считая участников проекта (всех трёх), только один автомобилист на десять лет, которому сын-программист поставил на навигатор осмокарту. А если рисовать в яндексе, карту сразу увидят все.

(Это третья и заключительная часть полемики, после «Нас обогнали» и «С пиаром тоже всё плохо»)

Аргументы защитников «свободных данных» (я даже не могу их в свою корпоративную базу данных загрузить, какие свободные, вы что) одни и те же уже много лет. Самый главный — про загрузку карты в навигатор. А зачем? У меня в цену навигатора входила подписка на ситигид с хорошими, ежемесячно обновляемыми картами. За границей iGo рвёт любительские карты на части. А на смартфоне, планшете и компьютере есть пресловутый яндекс (за границей — гугль), даже с навигацией. С народной картой, которую я могу дорисовать. С пробками, векторными данными и офлайн-кэшем. И выглядит она значительно лучше, чем OpenStreetMap. Кстати, там ещё космические снимки и панорамы можно смотреть, не отходя от кассы.

Пользователей в народных картах больше, следовательно, достоверность выше. Тамошние модераторы следят за правильностью данных, и залётный умник не испортит мне карту аккурат перед важной поездкой. Данные структурированы гораздо лучше, и не нужно копаться в вики в поисках правильного тега. Есть чёткие правила, удобный редактор, отзывчивые сотрудники, мгновенно разрешающие все вопросы. Космоснимков значительно больше, чем у бинга. И никто не обложит матом за то, что за три часа работы в веб-редакторе я случайно затронул чьи-то «отношения».

Лицензия, на которую напирает программный текст в вики, — это хорошо. Я нарисовал тысячу контуров домиков в Длинных Жвалках, кто-нибудь может выгрузить все домики из проекта, включая мои, и, например, посчитать их количество. Или нарисовать карту из одних домиков. Офигенно концептуально. Настоящую пользу могут принести только структурированные данные. То есть, любой ГИС-проект (включая НЯК), кроме OpenStreetMap, где вместо структуры — тегопомойка, а в сообществе круглосуточные споры о базовых вещах. Открытые данные провоцируют создание сервисов на их основе, но качественные, структурированные данные делают это куда эффективнее. Стоимость последних, хоть и высока, всяко ниже стоимости причёсывания данных OSM.

А прежде чем вещать о лицензионной чистоте, объясните вот это.

Местечковость — вообще не аргумент. За пределами России и Африки эти любительские схемы не нужны: там государственные кадастровые службы и коммерческие картографические компании каждый кустик учитывают, не говоря уж о вещах, коими хвастаются осмеры, вроде велодорожек или скамеек. И поскольку в мире прогрессирует открытость, участники OSM вместо сбора данных просто берут и импортируют в нашу базу государственные открытые геоданные. Так же быстрее. В результате сообщество убивается, а OSM становится просто бледной тенью чужих данных, да ещё и с более ограничивающими условиями использования. И зачем тогда вообще начинать?

Участвовать в OpenStreetMap — значит создавать себе на ровном месте сотню препятствий ради мифических выгод от свободной лицензии. Тут же шагу нельзя ступить, чтобы не вляпаться в неполноту эпического Map Features, не ввязаться в бессмысленный спор, отнимающий всё свободное время, или не нарваться на вечно витающее над открытыми проектами «хочешь? сделай!» Яндекс и Гугль, напротив, делают всё возможное, чтобы не отвлекать участника от главного занятия, неоспоримо приносящего пользу всем: рисования карты.
2013   ВНЕЗАПНО   няк

Ты нас даже не представляешь

Позавчера Стив Кост написал в своём блоге пространную речь про людей, замыкающих на себе важные элементы инфраструктуры общественных проектов. Он утверждает, что в OpenStreetMap есть точки, контролируемые незаменимыми людьми, и другие участники сознаются, что не представляют, что будет, если те уйдут. Пора, говорит Стив, им уйти самостоятельно, чтобы мы разобрались, как распределять нагрузку, пока в проекте 900 тысяч участников, а не 9 миллионов.

Всё это — знакомый специалистам по надёжности сказ про Single Point of Failure. В краудсорсинговых проектах такие точки — это люди, конечно же. И действительно, несколько лет назад у нас над потлатчем работал один человек, над OWL — другой, тоже в одиночку, стили мапника контролировал третий, и цепь эта тянулась далеко. Но Ричард Фэйрхёрст правильно замечает в комментариях, что сегодня во всех этих ключевых точках уже выросло сообщество, и незаменимые люди уже не незаменимы. Более того, сегодня я с ходу могу назвать только одну SPF в нашем проекте. И это сам Стив.

К кому обращаются журналы и телевидение, когда нужно прокомментировать очередную победу OSM над другими картографическими проектами? Кто считается визионером, кому выпадает открывать каждый State of the Map? С кем наш проект ассоциируется у большинства технарей извне? Кто-то из пресс-пула? Нет. Это исключительно почётный председатель Совета OSMF и Создатель OpenStreetMap. Какие его недавние заслуги в проекте? На своём сайте он хвастается: «основал OSM» (2004 год), «организовал первый SotM» (2007 год), «основал Cloudmade» (тоже 2007 год), «запустил mapstraction» (2010 год, сейчас лучше посмотрите на djeo). Какие два его последних проекта? FrontDoor, где пользователи по снимкам бинга ищут входы в здание. В прошлом месяце Джеймс Фи спросил у Стива, где результаты. Не было ему ответа. И OpenGeoCoder, для которого Стив специально избежал OSM из-за потенциальных проблем с Share-Alike лицензией.

Отношение большинства активистов к импортам геоданных вы знаете. Только недавно в европейском сообществе полыхал флейм о французских сверхдетальных домиках. Опыт TIGER в США немногие считают удачным: только что завершившаяся «Операция Ковбой» концентрировалась на исправлении этих данных, импортированных пять лет назад. И какую важную проблему OSM идентифицирует Стив во вчерашней заметке, какое решение предлагает? Адресация, ну конечно же. В Америке слишком много домов, и все адреса не под силу собрать даже целому сообществу. Из-за того, что в OpenStreetMap сплошные пустоты вместо адресов, его невозможно использовать для геокодирования. А в Европе и Японии ситуация ещё хуже. Что же делать, как нам спасти проект? А давайте возьмём TIGER (который ужасен, он сам признаёт), вбросим его адресные данные в OSM и потом вручную исправим все их недостатки. Лучше, чем совсем ничего.

И тут я должен напомнить, что Стив Кост до сих пор представляет наш проект. Не немцы Йохен и Фредерик, статьи которых я боготворю. Не англичане Ричард, Гарри и Мэтт, апологеты холодного разума. Не австралиец Саймон Пул, председатель совета OSMF, и не канадец Ричард Вейт, руководитель рабочей группы по коммуникациям. Стив Кост. Только в октябре его пригласил в свой ГИС-видеоблог Джеймс Фи, редактор популярнейшего блога Spatially Adjusted. В начале сентября он открывал State of the Map US, в начале ноября рассказывал про OpenStreetMap чешскому ГИС-порталу. До сих пор Стив — лицо проекта, хотя уже давно не релевантен. Год назад это было забавно, но сегодня, я считаю, он начинает быть вреден для проекта, тормозя его развитие.

«У нас есть ключевые позиции, полностью занимаемые одиночками. Люди вокруг них открыто признаются, что не имеют понятия, что им делать после ухода таких одиночек. По-моему, это ужасно. По-моему, им нужно уйти, и тогда мы поймём, что мы должны делать». Стив, это ты про кого написал?
2012   блоги   ВНЕЗАПНО

Runge, не делай area:highway!

Прямо сейчас в чатике все восхищаются тем, как на мапсёрфере, самом красивом функциональном слое OSM, выглядят площади, обозначенные area:highway. Даже безотносительно эстетических качеств не могу не заметить: это ад.

Как люки и деревья, площадные дороги интересны в малых количествах. «О, смотрите, в OSM даже фонарные столбы отмечены — а у вас?» Именно этим микромаппинг импонирует опытным участникам: вместо многокилометровых прогулок с размокшими под дождём обходными листами значительно удобнее открыть спутниковый снимок, и — что вижу, о том пою. В окне видна крышка люка, а на спутнике есть улица, отмечаем. Поребрик, обязательно, и прописать его тип. Откроем справочник и определим виды всех деревьев во дворе. Как можно вытерпеть, что в редакторе дорога — это тонкая линия, а на спутниковой подложке — широченный проспект? А что за углом не отмечен мусорный бак, а магазины в соседнем доме два года как закрылись — мелочи.

Мы превращаем OpenStreetMap в холст, а JOSM — в графический редактор. Вместо интерпретации — закрашивание площадей. Зелёненькое — лес, синенькое — вода, серое — дорога. Какая разница, сколько там полос, каковы покрытие, максимальная скорость, разрешена ли стоянка! OSM — не место для полезных данных. Качество карты рассчитывается по количеству белых пятен на картинке. Нарисованы луг, землепользование, площади — хорошо. Проведена линия и расставлены точки (не важно, сколько на них тегов) — недостаточно.

Отсюда и импорты Корины, медленно накрывающей Европу. Отсюда и фаззер, ныне Scanaerial, закрашивающий сотни квадратных километров одним кликом. Мы носимся с лозунгом «не рисуем под рендер», но при этом в соседней теме требуем от авторов картостилей: «сделайте area:highway!» Будущее OSM — за площадями. Вся планета должна быть покрыта непрерывным слоем natural, затем слоем landuse, затем, лоскутно, слоями place, leisure, area:highway, building и прочими. У вас в потлатче каждая линия в куче мультиполигонов? Ну извините, это редактор такой плохой. Дороги перекопали, лес вырубили, а в жосме невозможно нормально разлепить полигоны? Ничего, через пару лет напишут удобный плагин, тогда и обновите карту.

Тем временем, ни один из существующих слоёв до сих пор не отображает дорожное покрытие. Даже на примитивном уровне «асфальт/не асфальт». Кому это нужно, в самом деле? Всё и так обозначено на картах генштаба, не выпендривайтесь и ездите с ними.

Выхода из этой ситуации два. Первый — запретить детальные космоснимки и прочие источники, кроме GPS-треков. Вернуться к основам, в 2005 год. Потеряем контуры домов, ну и что: для навигации всё равно достаточно адресов и прочих POI. А озёра можно рисовать и по Landsat. Может, в отсутствие возможности накликивать сотни тысяч объектов из воздуха, мы начнём ценить свойства тех немногих дорог и точек, которые увидели своими глазами. Пять осмысленных уникальных тегов на объекте станут минимумом, и станут популярнее валидаторы не количества, а качества.

Другой выход — принять то, что все рисуют под рендереры. И делать картостили не уровня «ура, я поддержал новый тип дорог, хвалите меня», а со сложной логикой, учитывающей на каждом объекте максимальное количество значащих тегов. Чтобы то, как выглядит дорога, зависело не от тега highway (который только всех запутывает), а от lanes, surface, width, smoothness, parking:lane и прочих. Чтобы насыщенность карты зависела не от количества полигонов natural и landuse, а от дорог и POI. Чтобы сторонние люди приходили на openstreetmap.ru и не восклицали «что за ужас», а выкидывали скачанные карты генштаба и нажимали кнопку «распечатать».

Но для этого авторы картостилей должны забыть о микромаппинге. А какой программист (у нас иных авторов нет) способен не отвлекаться на мелочи?
2012   ВНЕЗАПНО   теги
Ctrl + ↓ Ранее