45 заметок с тегом

блоги

Позднее Ctrl + ↑

Ты нас даже не представляешь

Позавчера Стив Кост написал в своём блоге пространную речь про людей, замыкающих на себе важные элементы инфраструктуры общественных проектов. Он утверждает, что в OpenStreetMap есть точки, контролируемые незаменимыми людьми, и другие участники сознаются, что не представляют, что будет, если те уйдут. Пора, говорит Стив, им уйти самостоятельно, чтобы мы разобрались, как распределять нагрузку, пока в проекте 900 тысяч участников, а не 9 миллионов.

Всё это — знакомый специалистам по надёжности сказ про Single Point of Failure. В краудсорсинговых проектах такие точки — это люди, конечно же. И действительно, несколько лет назад у нас над потлатчем работал один человек, над OWL — другой, тоже в одиночку, стили мапника контролировал третий, и цепь эта тянулась далеко. Но Ричард Фэйрхёрст правильно замечает в комментариях, что сегодня во всех этих ключевых точках уже выросло сообщество, и незаменимые люди уже не незаменимы. Более того, сегодня я с ходу могу назвать только одну SPF в нашем проекте. И это сам Стив.

К кому обращаются журналы и телевидение, когда нужно прокомментировать очередную победу OSM над другими картографическими проектами? Кто считается визионером, кому выпадает открывать каждый State of the Map? С кем наш проект ассоциируется у большинства технарей извне? Кто-то из пресс-пула? Нет. Это исключительно почётный председатель Совета OSMF и Создатель OpenStreetMap. Какие его недавние заслуги в проекте? На своём сайте он хвастается: «основал OSM» (2004 год), «организовал первый SotM» (2007 год), «основал Cloudmade» (тоже 2007 год), «запустил mapstraction» (2010 год, сейчас лучше посмотрите на djeo). Какие два его последних проекта? FrontDoor, где пользователи по снимкам бинга ищут входы в здание. В прошлом месяце Джеймс Фи спросил у Стива, где результаты. Не было ему ответа. И OpenGeoCoder, для которого Стив специально избежал OSM из-за потенциальных проблем с Share-Alike лицензией.

Отношение большинства активистов к импортам геоданных вы знаете. Только недавно в европейском сообществе полыхал флейм о французских сверхдетальных домиках. Опыт TIGER в США немногие считают удачным: только что завершившаяся «Операция Ковбой» концентрировалась на исправлении этих данных, импортированных пять лет назад. И какую важную проблему OSM идентифицирует Стив во вчерашней заметке, какое решение предлагает? Адресация, ну конечно же. В Америке слишком много домов, и все адреса не под силу собрать даже целому сообществу. Из-за того, что в OpenStreetMap сплошные пустоты вместо адресов, его невозможно использовать для геокодирования. А в Европе и Японии ситуация ещё хуже. Что же делать, как нам спасти проект? А давайте возьмём TIGER (который ужасен, он сам признаёт), вбросим его адресные данные в OSM и потом вручную исправим все их недостатки. Лучше, чем совсем ничего.

И тут я должен напомнить, что Стив Кост до сих пор представляет наш проект. Не немцы Йохен и Фредерик, статьи которых я боготворю. Не англичане Ричард, Гарри и Мэтт, апологеты холодного разума. Не австралиец Саймон Пул, председатель совета OSMF, и не канадец Ричард Вейт, руководитель рабочей группы по коммуникациям. Стив Кост. Только в октябре его пригласил в свой ГИС-видеоблог Джеймс Фи, редактор популярнейшего блога Spatially Adjusted. В начале сентября он открывал State of the Map US, в начале ноября рассказывал про OpenStreetMap чешскому ГИС-порталу. До сих пор Стив — лицо проекта, хотя уже давно не релевантен. Год назад это было забавно, но сегодня, я считаю, он начинает быть вреден для проекта, тормозя его развитие.

«У нас есть ключевые позиции, полностью занимаемые одиночками. Люди вокруг них открыто признаются, что не имеют понятия, что им делать после ухода таких одиночек. По-моему, это ужасно. По-моему, им нужно уйти, и тогда мы поймём, что мы должны делать». Стив, это ты про кого написал?

Снова про area

Конечно, одна из основных проблем модели OSM — отсутствие типа для полигонов. В очередной блогопростыне Jochen Topf напомнил об этом, а заодно дополнил предложение типа данных небольшим комментарием про его использование:
Определим «area» аналогично объектам «way»: список ссылок на точки и набор тегов. Первая и последняя точка в списке должны совпадать. Как будет выглядеть API для редактирования подобных объектов? Пользователь отправляет запрос с bbox для редактирования. Чтобы работать с запрошенной областью, нам нужны все точки внутри этого прямоугольника, плюс как минимум по одной дополнительной точке с краёв линий. Если полигон входит целиком — хорошо, иначе потребуется знать, какая сторона внешняя, а какая внутренняя. Для этого постановим, что все точки должны быть отсортированы по часовой стрелке (можно и наоборот, но чаще сортируют так). Теперь редактор сможет нарисовать многоугольник правильно (внутри загруженной области): с учётом тегов у него будут все требуемые данные.
Далее он утверждает, что если отредактированная таким образом часть полигона корректна, то и весь полигон не поломается. «У меня нет математического доказательства, но буду рад примерам обратного». В блоге, правда, отключены комментарии: интересно, а если просто отразить весь набор точек половины полигона относительно перпендикуляра к границе загруженной области?
 17 комментариев   2012   блоги

OpenStreetMap на дне

Можно ли сейчас использовать проект OSM как полноценный и достоверный источник геопространственных и справочных данных? Напрямую — нет. Ни как достоверный, ни как полноценный. <...> Если нужны самые актуальные данные, то ни о какой достоверности уже речи не может идти. Сам по себе этот компромисс в проекте OSM смещён строго в сторону актуальности. Т. е. беря данные напрямую из проекта, вы всегда берёте самые актуальные данные со всем самым актуальным вандализмом, без какой либо претензии на адекватность данных.
Макс Васильев написал развёрнутый ответ на предыдущую заметку. Он обращает внимание на то, что проще обучить десяток школьников с нуля, чем заставить опытных участников проекта что-то делать правильно, и что валидаторы самим существованием форсируют ограничения, не всегда обоснованные или разумные. Конечно, решения этих задач быть не может, потому что они — следствие модели OSM.

Политика do-ocracy подразумевает, что властью в проекте обладают те, кто делают инструменты, в том числе валидаторы и рендереры. Поэтому больной вопрос тегирования под рендереры не исчезнет, и с ростом количества валидаторов уже набирает актуальность вопрос правок под них. Мы разрешаем эти вопросы советом «думать своей головой», но, будем честны, в проекте очень немного людей, способных на недоверие к своим инструментам, и большая часть — как раз новички и школьники, которые делают так, как их научили. По сути, в их случае do-ocracy подменяется «властью учителя»: куда проще вбить свои представления о качественных данных лично, чем вести за собой всё сообщество целиком. Но это не решает вопрос качества данных, а лишь усугубляет его.

К сожалению, качество OpenStreetMap — это оксюморон. У каждого из семисот тысяч участников проекта особенное мнение о том, как нужно рисовать карту, и главной площадкой для обсуждения до сих пор остаётся вики, которая, вообще-то, не место для дискуссий. Поэтому механизм пропозалов разваливается, как замечают многие опытные участники, и проект возвращается к тому, с чего начинался: глобальной геопомойке, в которую каждый волен писать то, что захочет. И Макс абсолютно прав, что без сложной обработки наши геоданные использовать нельзя. Но. Это не означает, что нужно махнуть рукой на OSM и заниматься своими предобработчиками. Напротив, нужно искать новые определения качества, совместно работать над инструментами обработки данных, открывать новые дискуссии не только внутри страны, но на мировых площадках. Почти завершилось перелицензирование, и время думать над API 0.7, с пониманием, что отсутствие типа area — наименьшая из проблем модели OpenStreetMap.
 18 комментариев   2012   блоги

Гуру маперитива

Об этом блоге стоило написать ещё полгода назад: Артём Светлов несколько раз в неделю публикует у себя карты трамвайных маршрутов, новых московских кварталов и всякую инфографику. Он постоянно пытается увидеть всё своими глазами (и сфотографировать), интересуется железными дорогами всех типов и зданиями в стиле конструктивизма.
 1 комментарий   2012   блоги

Здания, тысячи их

Фредерик Рамм смотрит на импорт домов во Франции, и он его печалит. Сейчас 80% всех данных там — это дома. Из них меньше процента имеют адреса. Как с этим жить — непонятно. Он пытается донести ту же мысль, что я много раз высказывал без видимого эффекта: контуры домов по важности сопоставимы с лесами, и от их отсутствия карта не проигрывает. И ладно бы первый случай, так с границами во Франции тоже такая же петрушка. И ещё они импортировали Корину. Очень сложно не импортировать. Активных осмеров там немногим меньше, чем в России, но поддерживать все эти десятки миллионов объектов не под силу никому. Страна превратилась в склад данных, как когда-то Америка. И если не поменять модель данных OSM и не переписать инструменты, будет проще начать заново, чем разгребать эту кучу.
Ранее Ctrl + ↓

Мнения, высказанные на этом сайте, отражают точку зрения лично автора сайта и ничью больше: ни его бывших или настоящих работодателей, ни семьи и знакомых.