Позднее Ctrl + ↑

Первопереоткрыватели

В конце января рабочая группа по данным получила уведомление от перуанской компании: «семь лет назад ваши картографы стащили у нас геоданные, удалите их». DWG расчехлила Redaction Bot (специальный скрипт, который не только удаляет объекты, но и вычищает их из истории) и оперативно убрала заимствования вместе с правками, которые семь лет накапливались поверх них. Сообщество в Перу подготовило «пирог» для картирования и за три месяца перерисовало потерянное, о чём отчитался karitotp.

Ничего такого, о чём стоило писать новость: данные импортировать нельзя, и срока давности нарушения не имеют. Об этом уже была длинная заметка, добавить нечего. Мы уже экстренно востанавливали страны: например, Польшу, пострадавшую от перелицензирования. Да и диванные картовстречи, когда за пару дней отрисовываем города и районы, для нас не в новинку: вспомнить тот же Саранск.

Такие инциденты показывают силу сообщества. Но и его ограниченность. Картографов-любителей привлекают белые пятна, они любят дорисовывать дворовые проезды и домики в промзонах. Сообщество невероятно быстро делает базовую подложку в любом регионе мира: дороги, населённые пункты, гидрографию. Радуется анимации с было-стало и пишет посты в блог. А затем уходит.

Позавчера Александр Истомин нашёл кладбище мусорных точек в Саранске. Почти год там копятся объекты, которых нет на местности. Незаметно — потому и не удаляют? Нет. 22 апреля провели первый тестовый матч на новом стадионе «Мордовия», построенном к чемпионату мира. Вчера прошёл второй матч. Стадион открыт, все горожане о нём знают. На OpenStreetMap прямо сейчас там строительная площадка. Картографов не волнует: обновлять уже нарисованное не так интересно. Даже если картой OSM конкретно в этом месте будут пользоваться сотни тысяч туристов через Maps.me.

Но если взять и вычистить город от данных, осмеры всей страной соберутся и за выходные снова отрисуют его идеально, по свежайшим данным.

GDPR и мы

Регламент по защите данных GDPR обязывает юрлица, владеющие интернет-сервисами, получать согласие на обработку персональных данных, выдавать собранные данные субъекту и удалять их по первому требованию, и следить, чтобы данные обрабатывались только в соответствии с целями, которые подтверждены пользователем. Всё это работает уже два года, но через три недели включат санкции за неисполнение. А это, на минуточку, 20 млн евро или 4% от годового оборота, смотря что больше. Именно поэтому вы в апреле получили тонну почтовых уведомлений от твитера, гугля, фейсбука и других популярных сервисов.

Бдительные немцы начали обсуждать применимость регламента к OpenStreetMap ещё в марте прошлого года. Тогда на немецкой конференции внезапно всплыла тема приватности в контексте сайта «How Did You Contribute» Паскаля Найса. Мол, все эти пакеты правок и даты в открытом доступе — хорошо, но если их анализировать, можно вытащить слишком многое. Например, сайт Паскаля довольно точно отображает ваш район, часы активности и интересы. Из-за этого автор даже получал угрозы с требованием удалить личные данные.

Результатом стало требование залогиниться для просмотра профилей HDYC. Последовавшие споры в почтовой рассылке talk@ разбились о твёрдость немцев. Но спустя полгода Паскаль, всё-таки, позволил открывать свои профили.

Наступил апрель

Две недели назад Саймон Пул опубликовал 24-страничную резолюцию LWG по GDPR, результат полугода работы активистов OSMF с привлечением внешних консультантов. Зная принципы работы Совета, рекомендации юридической рабочей группы, скорее всего, будут приняты без изменений. Вот что советуют в техническом плане:

  • убрать метаданные из выгрузок данных (планеты), диффов и вывода OSM API для незарегистрированных пользователей;
  • под метаданными понимаются логин и числовой идентификатор пользователя, номер и атрибуты пакетов правок, и вероятно — метки времени у объектов;
  • сделать кнопку для полного удаления профиля (без геоданных) и предоставлять список удалённых пользователей сторонним обработчикам данных;
  • обновить и заставить пользователей подписать условия использования, ограничивающие способы обработки данных;
  • авторы сервисов, анализирующих данные, должны будут подписать договор с OSMF, либо самостоятельно разбираться с еврокомиссией.

Фредерик Рамм подготовил список изменений для каждого метода OSM API. Как видно, незарегистрированные пользователи не смогут получать информацию о пакетах правок, пользователях, заметках, GPS-треках и блокировках. Кроме того, придётся прикрутить авторизацию к сайту planet.osm.org, чтобы разделить его на две части: публичную с обрезанными данными и приватную с полным содержимым.

Запрос /map к OSM API традиционно используется для получения данных в заданной области. В 2016 году этот и другие запросы стало можно делать, передавая заголовки аутентификации: в этом случае не применятся ограничения по частоте запросов. После внедрения вышеупомянутых изменений разница будет более существенной, так как данные начнут разниться в зависимости от наличия аутентификации. Один из авторов Overpass API заметил, что сайт OpenStreetMap не передаёт эти заголовки при экспорте данных. Очевидно, похожие задачи придётся решать и авторам других веб-приложений для работы с данными OSM. Редактор iD уже готов.

Как готовятся другие

Роланд, автор Overpass API, бунтует: в мае прошлого года он написал заметку с фразами, апеллирующими к «1984» и «451°F»: мол, переписывание истории — это подрыв доверия к данным. Он считает, что пользователей с данными связывают только идентификаторы и логины: так давайте не прятать метаданные пакетов правок, а защищать пользователей. То есть, позволять им плодить сколько угодно новых user id, вручную или автоматически, чтобы размыть свой след в базе. Хотя едва ли это поможет тем 99% пользователей, которые не задумываются о приватности.

Сервис Overpass API работает без регистрации, и многие картографы пользуются им для редактирования карты. В будущем релизе 0.7.55 нет ограничений на метаданные.

Компания Geofabrik разделила свой сервер с выгрузками на два: для получения полных данных нужно зарегистрироваться на «osm-internal» и качать файлы из браузера, а на старом сервере пропали исторические дампы (*.osh.pbf) и вырезаны метаданные из обычных выгрузок. Там нет логинов и идентификаторов пользователей и пакетов правок, но метки времени сохранены. От этого файлы pbf похудели примерно на 10%.

Выгрузки от BBBike не содержат никаких метаданных, даже меток времени. «Идите на osm.org или заплатите 99 евро в месяц». Остальные сервисы регулярных выгрузок, включая французский, швейцарский или наш гис-лаб, не вносили никаких изменений в процесс: метаданные как были, так и остались.

Сервисы для анализа правок и поведения пользователей OpenStreetMap, не считая HDYC, всё ещё не требуют входа через OSM и не планируют сделать его обязательным. Как я понимаю, частных лиц регламент GDPR не касается, поэтому сервисы типа Who’s That, явно нарушающие приватность пользователей, не пострадают. Разве что придётся их подкрутить, чтобы скачивать диффы с сервера OSM под логином автора.

2018   osm.org   osmf   закон

Пока, Google Maps

Сегодня утром всех пользователей картографических сервисов Google озадачила новость про преображение платформы. Одиннадцатого июня мы будем наблюдать массовый слом почти всех сайтов и веб-сервисов на Google Maps. Как минимум, на тайлах появятся слова «for development purposes only», а геокодирование и маршруты просто отвалятся. И вот почему:

  • После 11 июня нельзя будет использовать никакие картографические сервисы Google без API-ключа.
  • Для получения ключа обязательно вводить номер кредитной карты. Да, даже если у вас простая страничка с картой «как добраться».

Также:

  • Ценообразование упростилось и напрямую зависит от количества обращений.
  • Бесплатная поддержка и мониторинг в облачной консоли для всех.
  • Все пользователи получат 200 долларов ежемесячно просто так на использование картографических сервисов.
  • Карты на мобильных устройствах останутся бесплатными.

Стало ли лучше? Бесплатные деньги — это круто, конечно. Раньше бесплатный лимит был 25 тысяч отображений карты в день (не тайлов, а карты целиком), и запросы стоили около 50 центов за тысячу. Теперь тысяча запросов стоит 7 $, и двухсот долларов хватит примерно на 28 тысяч отображений карты в месяц. Ваш сайт-визитка с картой и тысячью заходами в день станет платным.

В обсуждении новости на Hacker News — стон десятков разработчиков. Стоимость карт от Google у многих вырастет раз в десять. Где был ноль — там теперь несколько сотен, а то и тысяч, долларов. «Transition Tool» для обновления биллинга невероятно запутан. Люди всерьёз обсуждают заглушки из статичных карт, которые по клику подменяются интерактивными.

Отдавать номер кредитки гуглю боязно. Не только потому, что контроля над расходами станет меньше и одна интересная статья на хабре может опустошить ваш счёт. Но и потому что теперь, по сути, ключ API — ключ к вашей кредитке. Вы не сможете его спрятать, потому что он в коде JavaScript. Конечно, какая-то защита есть, но достаточно умелый программист придумает способ наказать вас за использование карт от Google.

Над пострадавшими разработчиками вьются сотрудники сервисов на основе OpenStreetMap. Нет, это не #switch2osm из оптимистичного прошлого: это Stadia Maps, TallyGo, Nextzen, Geocode.Earth и, конечно, Mapbox. У которого, как обратили внимание, стоимость коммерческого использования начинается с полутысячи долларов. А если продешевить и использовать стандартные тайлы в стандартном Leaflet — ну, вы все знаете, как «быстро» грузится наша карта.

Как картографам-любителям, нам интереснее всего, что станет не с московским велопрокатом или русским геокэшингом, которые имеют неосторожность оставаться с Google Maps. Вспомним викимапию: лучший проект по подписыванию гугловских снимков. Несмотря на то, что проект скорее мёртв, он ещё шевелится, показывая тонны рекламы и привлекая единичных картографов. Можно поменять подложку на снимки Bing или Яндекса, но тогда активируются их ограничения, которые едва ли слаще. Вероятно, через два месяца у нашего проекта станет конкурентом меньше.

А для остальных — переходите на OpenStreetMap. Простым проектам достаточно Leaflet или OpenLayers с одним из десятков открытых слоёв. А сложным придётся выделить бюджет на портирование кода (Google Maps не смотрит, какая у вас там подложка первая, заменить её недостаточно), построение собственного тайлового сервера и настройку других API, что окупится экономией от прощания с Google.

2018   switch2osm

Стиль виляет картографами

В середине февраля Matthijs Melissen, один из разработчиков стиля osm-carto, предложил улучшить отображение административных границ на далёких масштабах. Пул-реквест не только перекрашивает границы в тёмно-зелёный цвет, но и приглушает эти линии на воде. Посмотрите на результат на этой карте.

Поскольку изменения оказались велики, их решили разбить на части: первая затрагивает только водные границы. Под примерами отображения Matthijs добавил комментарий: «поскольку тег admin_level отсутствует на некоторых линиях границ, потребуется немного покартировать».

Долгое время стиль отражал схемы тегирования: рисовал всё больше и больше значков, разделял или объединял отображение дорог в зависимости от дополнительных атрибутов. Немало было и спорных решений: например, объединение highway=footway и highway=path. Но те решения следовали правилам тегирования, а не требовали что-то в них менять.

На этот раз не так: предлагаемые изменения требуют добавления тегов boundary и admin_level не только на отношения границ, но и на линии в их составе. Конечно, мы часто так и делали, но это не было обязательным. Теперь отсутствие тегов должно было сломать границы стран и регионов на всех масштабах, от самого первого. И поскольку это вопрос тегирования, Matthijs-у пришлось написать в рассылку tagging@.

Хорошая новость: в тему ответили уже девять человек, и все как один удивляются: «ты что, офигел, что ли». Приятно знать, что пропозалы всё так же не проходят — не только полезные, но и такие непродуманные, идущие от даже не технических ограничений, но лени разработчика.

Модератор, вот как помочь

Неделю назад вы узнали про галочку «посмотрите на мои правки» и соответствующий тег у пакета правок, review_requested=yes. Найти такие пакеты тогда было непросто, но теперь есть пара способов.

Во-первых, OSMCha научился фильтровать по этому атрибуту. В панели фильтров выберите свой район для BBox и в списке Reasons for Flagging выберите самую последнюю (на сегодня) причину: «Review requested». Жмите Apply и узрите список ченджсетов от сознательных новичков.

Паскаль Найс не остался в стороне, подсказав, как с помощью его сервиса «поиск подозрительных пакетов правок» найти ченджсеты с нужным тегом. Это несложно: оказалось, там есть поле для поиска по тегам. Этот список содержит все ченджсеты по России с просьбой проверить. Я ткнул в случайный пакет и обнаружил точку на картинке выше.

Включая галочку с просьбой, пользователи вызывают вас, опытных осмеров, на диалог. Просматривайте иногда список по своему району, или по всей России (14 ченджсетов за сутки, пока что), исправляйте ошибки новичков и обязательно отвечайте им в комментарии к пакетам правок. Начните с приветствия и благодарности за правку: они узнали об OpenStreetMap, не поленились изучить редактор и готовы к общению, это дорогого стоит. И только потом указывайте на проблемы и давайте ссылки на вики и форум. Возможно, так мы получим больше заинтересованных активных редакторов, чем игнорируя новичков или с порога отчитывая их за поломанные проспекты.

Дополнено: в следующую версию JOSM добавили аналогичную галочку с просьбой проверить правки.

Ранее Ctrl + ↓