Избранное

Позднее Ctrl + ↑

Толстый и тонкий

В начале марта Иван Мельников спросил в твитере: «это правда, что самое большое и маленькое здания в OSM — ошибки?» Давайте выясним.

Тег building — самый популярный в базе, если не считать бессмысленного source: 77 миллионов линий, 45% от всех линий OSM. Osmosis отфильтровал 80% планеты, оставив 3,8 гигабайта, которые osm2pgsql за два дня развернул в базу в 25 раз толще. То есть вся планета потребовала бы полтерабайта. Попутно я узнал, что в среднем на 10 зданий приходится 53 узла, без учёта общих точек (по отдельности получится около 60-61 узла, как пишет статистика гис-лаба). 1/4,4 всех точек в базе принадлежит зданиям, и лишь у 37 идентификаторы меньше миллиона.

Я обрабатывал отдельно отношения и линии. Первых оказалось совсем немного, 85 тысяч. Из трёх самых больших мультиполигонов зданий два — автозаводы близ Торонто: General Motors (563 тыс. м²) и Toyota (284 тыс. м²). Второе по размеру «здание» — крепостная стена Сианя, древней столицы Китая: 322 тыс. м². Все эти мультиполигоны правильные, хотя в Канаде одним контуром обведены по три здания, а стоит ли стену обозначать как building — непонятно.



На этой фотографии заснято самое большое по площади основания здание: фабрика Boeing в Эверетте, США. Официально 398 тыс. м², в OSM — 385, в пределах погрешности. Однако у нас оно не входит даже в первую сотню. Топ-5 на 14 февраля таков: Как видно, эта часть теории подтверждается. Теперь обратимся к другому концу рейтинга. Главная проблема с мелкими полигонами — что площадь некорректных геометрий (с самопересечениями, дубликатами рёбер и т. п.) вычисляется как очень малая, но не нулевая. Если верить сортировке по столбцу площади, то да, самые маленькие <любые типы объектов> — ошибки. Но интереснее найти настоящие здания. Таким среди мультиполигонов будет ромбовидное здание, созданное Komяpой: 0,026 м². После него идут два правильных, но очень маленьких мультиполигона в Жироне, Испания, площадью 0,48 и 0,55 м², и дом в Калифорнии с двухсантиметровым стенами (0,68 м²): его контур inner едва меньше outer.

Познакомьтесь с самым маленьким (на 14 февраля) зданием в OpenStreetMap: домик в Словакии площадью 0,023 мм². На карте он выглядит бледной точкой. Даже используя буферизацию, не удалось избавиться от всех кривых геометрий, но второе и третье места по площади занимают дома в Сан-Франциско: 1.8 и 3,2 мм². Остальные здания рекордных размеров вы можете поискать самостоятельно.

В итоге, как резюмируют на MythBusters, CONFIRMED: сколько ни исправляй ошибки, самые большое и маленькое здания в OpenStreetMap не соответствуют зданиям на местности.

В июне в Сан-Франциско, в сентябре — Бирмингем

Американцы, незаметно оказавшиеся самыми активными пользователями OpenStreetMap, проведут очередную региональную конференцию в Сан-Франциско, на выходных 8-9 июня. Дополнительно в пятницу они организовывают мастер-классы по рисованию и использованию данных OSM, а в понедельник предоставят комнаты и все условия для программистов, работающих над OSM-инструментами.

Из двух английских заявок рабочая группа SotM выбрала Бирмингем: 6-8 сентября именно там пройдёт главная конференция OpenStreetMap. Наконец-то город, куда из Европы и России несложно и недорого добраться. Таким бы не был, например, Буэнос-Айрес в Аргентине: заявка из него опоздала на неделю. Впрочем, и нынешний расклад не всех устраивает: с 17 по 21 сентября более крупная ГИС-конференция FOSS4G пройдёт всего в 80 километрах, в Ноттингеме, и чем занять неделю между событиями — непонятно.

Загадкой остаётся «серьёзная» конференция от Стива Коста, о которой он объявил в октябре: сайт до сих пор остаётся заглушкой с предложением подписаться. Всё как полагается для корпоративных мероприятий.

И вообще

Может, не так плохо рисовать «на дядю», а не в открытом проекте? Одна из наших целей — дать карту самых удалённых уголков каждому. Нарисовал я, значит, деревню на OSM, и кто её увидит? Не считая участников проекта (всех трёх), только один автомобилист на десять лет, которому сын-программист поставил на навигатор осмокарту. А если рисовать в яндексе, карту сразу увидят все.

(Это третья и заключительная часть полемики, после «Нас обогнали» и «С пиаром тоже всё плохо»)

Аргументы защитников «свободных данных» (я даже не могу их в свою корпоративную базу данных загрузить, какие свободные, вы что) одни и те же уже много лет. Самый главный — про загрузку карты в навигатор. А зачем? У меня в цену навигатора входила подписка на ситигид с хорошими, ежемесячно обновляемыми картами. За границей iGo рвёт любительские карты на части. А на смартфоне, планшете и компьютере есть пресловутый яндекс (за границей — гугль), даже с навигацией. С народной картой, которую я могу дорисовать. С пробками, векторными данными и офлайн-кэшем. И выглядит она значительно лучше, чем OpenStreetMap. Кстати, там ещё космические снимки и панорамы можно смотреть, не отходя от кассы.

Пользователей в народных картах больше, следовательно, достоверность выше. Тамошние модераторы следят за правильностью данных, и залётный умник не испортит мне карту аккурат перед важной поездкой. Данные структурированы гораздо лучше, и не нужно копаться в вики в поисках правильного тега. Есть чёткие правила, удобный редактор, отзывчивые сотрудники, мгновенно разрешающие все вопросы. Космоснимков значительно больше, чем у бинга. И никто не обложит матом за то, что за три часа работы в веб-редакторе я случайно затронул чьи-то «отношения».

Лицензия, на которую напирает программный текст в вики, — это хорошо. Я нарисовал тысячу контуров домиков в Длинных Жвалках, кто-нибудь может выгрузить все домики из проекта, включая мои, и, например, посчитать их количество. Или нарисовать карту из одних домиков. Офигенно концептуально. Настоящую пользу могут принести только структурированные данные. То есть, любой ГИС-проект (включая НЯК), кроме OpenStreetMap, где вместо структуры — тегопомойка, а в сообществе круглосуточные споры о базовых вещах. Открытые данные провоцируют создание сервисов на их основе, но качественные, структурированные данные делают это куда эффективнее. Стоимость последних, хоть и высока, всяко ниже стоимости причёсывания данных OSM.

А прежде чем вещать о лицензионной чистоте, объясните вот это.

Местечковость — вообще не аргумент. За пределами России и Африки эти любительские схемы не нужны: там государственные кадастровые службы и коммерческие картографические компании каждый кустик учитывают, не говоря уж о вещах, коими хвастаются осмеры, вроде велодорожек или скамеек. И поскольку в мире прогрессирует открытость, участники OSM вместо сбора данных просто берут и импортируют в нашу базу государственные открытые геоданные. Так же быстрее. В результате сообщество убивается, а OSM становится просто бледной тенью чужих данных, да ещё и с более ограничивающими условиями использования. И зачем тогда вообще начинать?

Участвовать в OpenStreetMap — значит создавать себе на ровном месте сотню препятствий ради мифических выгод от свободной лицензии. Тут же шагу нельзя ступить, чтобы не вляпаться в неполноту эпического Map Features, не ввязаться в бессмысленный спор, отнимающий всё свободное время, или не нарваться на вечно витающее над открытыми проектами «хочешь? сделай!» Яндекс и Гугль, напротив, делают всё возможное, чтобы не отвлекать участника от главного занятия, неоспоримо приносящего пользу всем: рисования карты.

Leaflet для ленивых

В январе появилось сразу два сервиса для создания интерактивных карт на основе leaflet. То есть, на сегодня таковых уже четыре — и это только тех, что заявляли о себе в сообществе OSM. Я сравнил их по взятому с потолка набору критериев:

Критерий uMap openstreetmap.ru MapBuild Виджет с GSoC 2012
Регистрация OAuth из twitter, osm, github нет нет нет
Название карты есть, также можно указать лицензию нет есть нет
Выбор подложек 10 штук 7 штук, не сохраняются 12 штук 4 штуки
Рисование объектов маркеры, линии, полигоны маркеры и линии нет (маркеры из CSV) маркеры и линии
Вид маркера форма и символ цвет форма и цвет выбор из заготовок
Информация об объекте название и описание название и описание название, описание, ссылка и т. д. название (кроме «цели»)
Импорт GPX, KML, GeoJSON нет CSV: координаты, адреса, IP нет
Экспорт нет GPX таблица данных нет
Встраивание iframe, прямая ссылка iframe, прямая ссылка iframe, прямая ссылка ссылка через bit.ly, iframe
Кто может редактировать автор, кто угодно или по списку обладатель секретной ссылки никто никто
Хранит данные на сервере на сервере на сервере в ссылке
Пример открыть открыть открыть открыть
Исходники Bitbucket, MIT? GitHub, BSD нет GitHub, ?

Виджет, созданный студентом прошлым летом в рамках программы Google Summer of Code, так и не завершён, и пользоваться им сложно. Сайт MapBuild идеален, если нужно быстро выложить в сеть набор геопривязанных точек: поскольку он не требует своего хостинга, получается удобнее, чем евросоюзовский интерфейс. Функциональность пользовательских карт на openstreetmap.ru удобна для быстрого наброска: пара точек, маршрут — и можно отправлять. Но самый многообещающий проект из упомянутых — это uMap (вероятно, его скоро переименуют): он активно развивается, позволяет настраивать почти каждый аспект карты и ответственно относится к правам доступа и лицензии. Жаль, что пока не появилось проекта, создающего из пользовательской карты готовый HTML-код.

Откуда и куда



Zartbitter сделал перерыв в своих десяти тысячах правок, чтобы подарить нам карту ограничений поворотов и ошибок в них. Она построена на Overpass API и обрабатывает данные OSM джаваскриптом, от чего работает быстрее, нежели старый Restriction Analyser (который до сих пор ждёт ответа от XAPI). Обновления карты, при этом, подхватываются за несколько минут.
Ранее Ctrl + ↓

Мнения, высказанные на этом сайте, отражают точку зрения лично автора сайта и ничью больше: ни его бывших или настоящих работодателей, ни семьи и знакомых.