ШТОСМ

Моря коричневых квадратиков

Вы, наверное, слышали об инициативах HOT, особенно о серии картовстреч Missing Maps. Добровольцев сажают за JOSM и учат обклацывать домики в Центральной Африке. Результатом становятся сотни тысяч контуров с building=yes, которые аналитики используют для планирования акций помощи.

Jean-Marc Liotier намедни задал вопрос, столько неожиданный, сколько и очевидный: а зачем это всё? Добровольцы оставляют жутко неточную карту, на которую опытный осмер без слёз не взглянет. Дороги недорисованы, POI отсутствуют, будущим африканским мапперам будет проще удалить это всё и начать с нуля.

Зачем вообще рисовать контуры? Для анализа населённости достаточно нарисовать полигон landuse=residential с атрибутом плотности. На крайняк — вместо контуров ставить в центре домиков точки со всеми нужными тегами. У аналитиков будет способ посчитать население, а карта не пострадает. Зачем тратить время и силы ценного человеческого ресурса на работу, которую осмеры захотят удалить?

Для зарождающегося африканского сообщества эти недокарты вообще мина: здесь не кривые линии дорог нужно выправлять, как после импорта TIGER американцам, здесь каждый домик нужно скрупулёзно передвигать на правильное место. Любой, кто этим занимался, схватится за голову.

В рассылках вопрос поддержали опытные осмеры, а члены HOT ответили, но как-то не по существу. Про пользу да про валидаторов, которых всегда не хватает, потому что это не так интересно. Нет вопроса о пользе карты для кого-то, кроме аналитиков HOT, в справочнике команды. Никто не подумал. Проблемы не белых людей.

Один из вариантов ответа: встречи Missing Maps — отличный способ завербовать далёких от картографии людей в OpenStreetMap. Научить их редактированию и показать осязаемую пользу от работы. Да, качество их домиков будет ниже плинтуса, но если мы берём за цель их участие в сообществе, то то, что они нарисуют, можно удалить. Главное, что человек завяз.

Работа гуманитарной команды поднимает сразу несколько вопросов. Например, чем сотни тысяч нарисованных добровольцами домиков лучше автоматического импорта домиков из сторонней базы (тут как раз Bing пожертвовал 125 миллионов)? Наши правила запрещают массовые правки без обсуждения, но здесь же живые люди обклацывают снимки. Да, качество так себе, да, придётся большую часть удалить. При этом, сообщество не приемлет автоматические правки и импорты. Главный аргумент — потому что данные из сторонних источников всегда уступают тёплым ламповым нарисованным вручную домикам.

Впрочем, организованное редактирование скоро тоже зарегулируют новым регламентом. Он гласит, что если вы собрались больше трёх, то посчитаем это импортом: косо посмотрим, сплюнем, спросим за район.

Почему появился этот регламент? Некоторые компании начали платить мапперам за улучшение карт густо населённых районов, и осмеры из этих районов возмутились. Импорты и организованное редактирование никого не волнуют, пока не нарушают главное правило: только не на моём участке. Стоит задеть территорию опытного осмера, как узнаешь про много разных правил и ограничений. Классы дорог не трожь, используй contact:website вместо website, каждый POI должен быть проверен на местности и подтверждён нотариально заверенной фотографией. Правило «Не на моём участке» в сообществе идёт первым, до лицензии и проверяемости. Гуманитарной команде позволяют работать в Африке только потому, что там нет увлечённых мапперов, которые от очередного набега придут в ужас.

Наконец, проблема сотен тысяч домиков поднимает через Жана-Марка тот же вопрос, какой должен задавать себе каждый из нас: зачем мы картируем? Чем мы руководствуемся при выборе тегов и объектов для картирования, и какой конечный результат покажет нам, что мы выполнили свою работу хорошо? Линия на стандартном картостиле? Слово «МакАвто» в результатах поиска на смартфоне? Размер файла с выгрузкой города? Числа в валидаторе? Какой бы ни была ваша метрика, не бойтесь поделиться ею на форуме или в чатике: вам не только помогут найти лучшие источники и модули редакторов для работы, но и объяснят, почему ваша работа не имеет смысла. Мы всегда рады помочь.

6 июля   hot   ВНЕЗАПНО

Знаки

Вчера на форуме в очередной раз высказали мнение, что будущее открытой картографии — за автоматическим распознаванием. Несколько компаний исследуют это направление уже много лет. Самая заметная из них — Mapillary, «народные панорамы». Дождавшись, когда база фотографий подрастёт до сотен миллионов, они начали выяснять, что же на них запечатлено. В январе 2015 года Mapillary показали слой с дорожными знаками и спустя несколько месяцев добавили его в JOSM и iD.

Две недели назад они анонсировали большое обновление набора дорожных знаков. За это время от машинного зрения они перешли к машинному обучению, прокатали через него на порядок больше снимков, а в октябре ещё и запустили «игру», в которой человеку нужно оценить точность распознавания.

Telenav с их конкурирующим проектом OpenStreetCam занимается примерно тем же — но с конкретной целью улучшить OSM, а не только собрать базу «на всякий случай». Филипп Кэндал, руководитель разработки, рассказал в 2016 году, что его команда пишет распознавалку знаков и указателей и уже уточнила двадцать тысяч ограничений на карте. За автоматикой, по его словам, будущее.

Для картографов OSM знаки в плагинах Telenav появились только в феврале этого года: всего полмиллиона и лишь в США и Канаде. Зато они сравнивают распознанные ограничения с данными OpenStreetMap, и картографов можно оповестить о необходимости уточнить карту. В апреле эту функциональность добавили в модуль для JOSM.

Наконец, в мае Telenav снова признался в верности открытому сообществу, опубликовав весь код распознавания знаков и натренированную модель под открытой лицензией Mozilla. Саму базу знаков тоже скоро откроют. Мартайн предлагает задействовать эту нейросеточку для распознавания новых типов объектов: скамеек, фонарных столбов, остановок. Чтобы это открытие не прошло незамеченным, Telenav объявил конкурс: сделайте свой проект до 17 августа и выиграйте 10 тысяч долларов — если он распознает более 94% объектов. Условия расплывчаты — вероятно, более опытные участники таких конкурсов поймут, что к чему.

А что Mapbox? Странным образом, они тоже участвуют в этом ажиотаже — но до недавнего времени только командой картографии. В 2016 году они собрали интерактивную карту, сопоставляющую знаки от Mapillary и данные OSM (что Telenav, напомним, делает автоматически) и улучшали нашу карту — только в США, конечно. 13 июня этой карте пришёл конец, хотя все исходники доступны на github. А на следующий день Вирджиния из команды машинного обучения Mapbox раскрыла, что они взяли у Bing снимки StreetSide на 23 американских города, прогнали их через нейросеточки и получили новую интерактивную карту со 184 тысячами распознанных ограничений движения. Их команда картографов медленно продирается через этот набор данных, но от помощи они не откажутся.

Все эти компании распознают знаки на фотографиях, но автоматизируют только это — и, иногда, сопоставление с ограничениями в OpenStreetMap. А внесение в базу геоданных — ни-ни. Отчасти потому, что знаки не соответствуют никаким объектам на карте, они лишь задают свойства для уже существующих дорог. Причём не всегда привязанные к координатам знаков. Сопоставлять знаки и карту непросто, тем более, если с целью карту улучшить.

Другая причина — сообщество OSM не разделяет мнение Филиппа, что автоматическое распознавание — будущее картографии. Лучше в сто раз медленнее, но руками, с тёплыми ламповыми ошибками и чувством удовлетворения от работы, неведомым алгоритму. Фейсбук уже несколько лет пытается переломить это заблуждение — на конференции SotM в Милане через месяц они снова расскажут, как взаимодействуют с сообществом в Таиланде, куда импортируют распознанные нейросетями дороги.

30 июня   источники

Внезапные панорамы

Месяц назад в репозитории редактора iD неожиданно появился пул-реквест от Джубала Харпстера. В описании он был лаконичен: «интегрирует снимки StreetSide в редактор. На здоровье. —Микрософт». «Но их же нельзя использовать», — сразу ответил Пол Норман.

Мало кто в восточном полушарии знает, что панорамы есть не только у Google, Яндекса и Baidu. Список подобных сервисов в википедии очень длинный, но в разделе всемирного покрытия пока только две компании с проприетарными панорамами. Вторая — это Microsoft Bing. Их StreetSide запущен в 2009 году и покрывает большую часть Соединённых Штатов и крупные города в Великобритании, Франции и Испании. Вы не увидите эти снимки: «Вид с улицы» доступен только жителям городов внутри области покрытия.

Смотрители проекта iD не так въедливы, как у сайта OSM. Брайан просмотрел на эти семь коммитов от Шоны Паради и Лорена Мюллера, нашёл несколько недочётов и то ли помог их исправить, то ли отредактировал код сам — интерфейс гитхаба не дал понять. Так или иначе, неделю назад запрос был принят, и 14 июня выпущена новая версия редактора с панелью StreetSide. Включается она там же, где Mapillary и OpenStreetCam: кнопкой данных карты, справа под кнопкой слоёв.

Что касается лицензии, Пол немного опоздал с заявлением. Как обнаружил Майкл Райхерт, ещё в апреле Микрософт обновил условия использования своих сервисов, явно разрешив подсматривать в StreetSide для уточнения данных. Немцам, впрочем, от этого мало пользы: их соотечественники успешно отразили все попытки Bing Maps отснять их территорию.

Разумеется, разрешение касается не только редактора iD. В том же пул-реквесте Джубал ответил на несколько вопросов насчёт лицензии, подтвердив, что панорамы можно использовать и в настольных редакторах. Несложно найти код модуля для JOSM, на которым последние несколько дней работает Рене Роудс. Полноценной поддержки придётся подождать в обоих редакторах: вон, в модуле для iD уже нашли ошибку при масштабировании снимка.

Как сотрудники Bing Maps напоминают в пресс-релизе, это не первый их подарок сообществу открытых карт. Каждый пользовался снимками Bing для обклацывания домиков и дорог. Из недавнего, год назад они предоставили OpenStreetMap десять миллионов геометрий зданий в 44 штатах Америки вместе с высотами, которые нарисовали самостоятельно по детальным снимкам и ЦМР. Приятно, что Микрософт уже много лет не отворачивается от открытых сообществ. Спасибо им.

21 июня   id   источники

«Этот пользователь является вандалом»

Вчера на нашем сайте появились многословные ссылки «сообщить об этой ...». Их можно найти у каждой статьи в дневнике и комментариев к ней, у пользователей и у заметок на карте. При нажатии вы получите форму жалобы модератору, где нужно оценить содержимое текста или профиля (спам, непристойности, угрозы). Со страницы заметки на карте можно пожаловаться на раскрытие личных данных, а у пользователя — пожаловаться на вандала. Жалоба попадёт в ленту, доступную модераторам сайта OSM, которые решат проблему.

Автором этого улучшения можно считать Энди Аллана, который работал над пул-реквестом с июля прошлого года. Но его история куда длиннее. Идея появилась в сентябре 2014 после очередной волны спама в дневничках. Том Хьюз тогда написал, что планирует добавить кнопку модерации к объектам сайта. Но ничего не произошло.

Далее, в 2015 году Shrey Bagroy предложил поработать на модерацией в рамках Google Summer of Code. Под руководством Серге Вроцлавского он программировал всё лето. Ветка была готова, но из-за каких-то разногласий Shrey не создал пул-реквест, ветка начала стареть, а студент, как водится, исчез сразу после получения денег.

Год спустя Гильем Ришар оформил ту ветку в пул-реквест. Оказалось, в ней немало проблем: непереводимые сообщения, странные костыли в модели данных, беспорядок в разграничении прав. Мэтт Эймос попробовал исправить самые явные проблемы, но сдался. По традиции, все выждали полгода перед комментированием и затем, в феврале 2017, посокрушались, что работы тут непочатый край. Наконец, в июле Энди взял работу Shrey с исправлениями Мэтта и каждый месяц что-то улучшал. Спустя год и более сотни коммитов, его пул-реквест приняли и выкатили на сайт.

Этот проект был в числе десяти важнейших задач, список которых в феврале этого года обновила рабочая группа по разработке. Теперь задач осталось девять. Среди них есть как технически простые, вроде списка комментариев к пакетам правок для пользователя, так и сложные, вроде типа area или наследника OWL. Если решитесь помочь сообществу, взявшись за одну из задач, то там же найдёте ссылки на работы на ту же тему и людей, к которым можно обратиться за помощью и руководством.

19 июня   osm.org

Где ЧМ?

Гарри Вуд поставил изображением недели карты всех двенадцати стадионов ЧМ 2018. В сравнении с яндексом — всё плохо, кроме Фишта и Лужников. Прилично выглядят ещё Спартак, Санкт-Петербург, Казань и с большой натяжкой Ростов. А остальные шесть — совсем никак.

Возникает вопрос, почему сообщество не бросилось отрисовывать стадионы. Мы же когда-то обклацали весь Саранск за два дня (без стадиона) и маленький городок Краснохолм лишь по просьбе одного человека. Почему нам не удалось поднять сообщество улучшить карты нескольких мест, которые помогут сотням тысяч туристов?

Для успешной «диванной картовстречи» нужны три условия: польза, источник, метрика. Первое понятно: спасаем жертв потопа, как в HOT, или делаем популярный сайт с нашей картой демонстрацией мощи сообщества, как в Саранске. Источником почти всегда являются детальные космоснимки, которыми, слава Bing, Mapbox и Esri, покрыта почти вся Россия. Иногда, как в случае Крымска, помогают адресные планы и репортажи с мест. А метрика повышает мотивацию: когда карта «готова на 75%», это побуждает поднажать и закончить, или, хотя бы, довести до 90%. Это не простые скриншоты, которые годятся только для прогулочных картовстреч, где главная метрика вообще нематериальна.

Главное условие, впрочем, находится над этими тремя: это воля организатора. Должен быть кто-то, кто опишет пользу, перечислит источники и составит и, возможно, запрограммирует метрику.

В случае стадионов не было такого организатора. Мы понимали, что хорошо бы их закартировать, но не оформили это в проект. Да и как, когда у нас до сих пор нет снимков? На сегодня, 100% инфраструктуры можно закартировать только у Лужников, Фишта и Казань-арены. Почти готовы на снимках ещё Спартак и стадион Санкт-Петербург. Остальные семь — либо на разных этапах строительства, либо вообще чистое поле, как в Калининграде. Luiswoo, картограф Ростова-на-Дону, — герой, что нарисовал хоть что-то поверх сплошной стройки.

Ну и без метрики рисовать неинтересно. Нужно создать, как минимум, «пирог» с разбивкой карты на удобные фрагменты, которые могут забрать для отрисовки участники. Нужно делать картинки «до» и «после». В идеале — посчитать численные изменения и каждый день, каждый час отслеживать состояние карты и подбадривать участников. На это не пошли даже коммьюнити-менеджеры яндекса, что уж говорить про нас, когда мы ничего не можем сделать с источниками.

Тем не менее, болельщики приехали и активно пользуются приложением-партнёром Ростуризма, которое совершенно случайно основывается на картах OpenStreetMap: MAPS.ME. Авторы выпустили официальные маршруты (наборы закладок) и специальную сборку карты, на которой подсвечены объекты, относящиеся к ЧМ. Иногда их пришлось добавлять поверх карты, поскольку нарисовано на наших картах не всё. OpenStreetMap снова победил — жаль, что на этот раз не качеством карт.

Ранее Ctrl + ↓