ШТОСМ

Открытость — не порок

Прошлая заметка расстроила главного адепта тепловых карт Strava в России. Павел Гаврилов сделал всё, чтобы они не прошли мимо: сделал вики-страницу лучше любого перевода, а в своём проекте «Трансграничье» подробно объяснил, чем этот набор треков лучше любых других, включая OSM. Собственно, если вы на велосипеде забрались в дебри Подмосковья и внезапно благодаря карте OpenStreetMap вырулили в соседний район — очень вероятно, что Павел вам помог, найдя перемычку в треках Strava. Он один из тех маперов, которые делают карту OSM безальтернативной, лучшей в мире.

Я был неправ, говоря, что слой треков никому не нужен. Мы видим, что нужен — для уточнения отдельных мест. Всегда найдётся человек, который придумает, как использовать очередной источник, и удивит нас системным подходом к делу. Но никакой системный подход не смасштабируется на мир без активного участия создателей слоя. Strava не только не работает над улучшением OSM по своим данным: другим компаниям она вообще обрубает доступ за активность. Наше картирование прокатывает, потому что мы проходим под радарами: не распространяем кэш тайлов, срисовываем какие-то крохи, вполне умещающиеся в Fair Use.

Но разрешения на использование тепловой карты Strava у нас всё равно нет. И, честно скажем, никогда не было. Всё, что было, — твит 2014 года от бывшего сотрудника, который, если читать до буквы, — разрешает использовать тайлы конкретно Гильёму Ришару для любой картографии, — и письмо 2019 года, в котором нынешний сотрудник Strava Metro поговорил с коллегами и не видит препятствий для обклацывания их тепловой карты. Оба этих сотрудника и те, кто их спросил, молодцы. Но мы эти препятствия видим. Потому что у нас нет явного согласия.

Каким должно быть разрешение, чтобы можно было использовать данные в OpenStreetMap? Начнём с того, что карты — это сложно. И определить, какая часть геопривязанных данных защищена авторским правом, а какая — нет, часто невозможно вне суда. Например, тайлы OSM Carto публикуются под CC-BY-SA, но если перерисовывать с них линии в отдельную карту, то мы нарушим условия ODbL, потому что начнём создавать зависимую (derived) базу данных. А если сделаем свой картостиль с теми же цветами, то нарушим авторское право на оформление, которое — какой сюрприз! — не покрывается объявленным CC-BY-SA. Вернее, нарушили бы, если бы в случае OSM Carto оно не было явно открыто под CC0.

Данные по типу использования в OSM можно разделить на четыре категории. Они более-менее точно определяют, какое разрешение требуется от правообладателя, но понять, в какую из них попадают данные, не всегда просто.

  • Общественное достояние или CC0: единственный вид данных, которые можно загружать в OpenStreetMap без вопросов и разрешений. В России мы считаем, что в общественное достояние попадают только тексты законов, а в Штатах это все данные, оплаченные налогами.
  • Аттрибуция, CC-BY: можно было бы загружать в OSM, если бы не требование указания автора. Придётся согласовать, что строчка на вики-странице Contributors, на которую ссылается osm.org/copyright, удовлетворит публикатора. Достаточно твита или ответа в соцсеточке — главное, чтобы от руководства.
  • Проприетарное и Share-Alike: лицензия или условия использования прямо говорят, что нельзя. Для загрузки в OSM требуется письменное разрешение (как у Bing) или специальная строчка в условиях использования (как у Mapillary).
  • Чёрт его знает: некоторые источники мы не копируем и не используем в тех смыслах, в которых их ограничивает лицензия. И тогда непонятно, нужно ли вообще разрешение. Сюда попадают фотографии и панорамы, словесные описания границ, и даже спутниковые снимки. Мы считаем, что запрещено всё, что явно не разрешено, поэтому здесь тоже нужно какое-то минимальное разрешение от правообладателя.

Последний пункт интересен тем, что вызывает больше всего споров. На простой вопрос — почему нельзя обклацывать снимки гугля? — никто не может дать внятного ответа, кроме «потому что так заведено». Кадастровая карта балансирует где-то между третьей и четвёртой категориями, постепенно двигаясь к полной закрытости. Являются ли адресные планы общественным достоянием? А чёрт его знает — но от безысходности мы решили приравнять их к текстам законов и пользоваться без ограничений.

У разрешения три обязательных условия:

  1. Оно даётся от имени правообладателя человеком, на это санкционированным. Например, официальным аккаунтом в социальных сетях, руководителем или юристом компании.
  2. Разрешение должно разрешать. Не «не видим ничего плохого», а твёрдое «да» или «разрешаем», на худой конец — «не против».
  3. Разрешение должно быть зафиксировано на бумаге или в электронном виде. Восемь лет мы использовали яндекс-панорамы на основании телефонного звонка, что неправильно, но ввиду категории «чёрт его знает» допустимо. Потому что для этой категории важно знать, что компания не пойдёт в суд. Только этим летом Владимир Кривоконь получил разрешение правильно, в письме.

Всему этому может удовлетворить одна бумажка. Валерий Трубин в русском сообществе поднаторел в написании писем в муниципальные департаменты, чтобы те давали правильные ответы. Попросите его помощи, если данных не хватает. Но бумажные ответы — это русская специфика, где без печати ответ недействителен. Американцы часто довольствуются твитом. Как понять, имеет твит юридическую силу или нет? С проприетарными данными лучше состорожничать и пинать правообладателя до тех пор, пока он в сердцах не швырнёт в лицо письменное разрешение.

Понятно, к чему я веду: у разрешения от Strava Metro, которым мы размахиваем, нарушены первые два условия. Ни в твите, ни в письме нет явного разрешения на обрисовку в OSM всем сообществом. И в первый раз разрешение давал Пол, в то время просто руководитель одной из команд внутри Strava Labs, но точно не ответственный за распространение данных. Во второй раз — руководитель проекта Strava Metro, что уже ближе: этот проект позволяет использовать собранные данные для планирования городов, так почему бы им не позволить использовать их для OSM. Но пока все три условия не выполнены, сделать ничего нельзя.

3 декабря   закон

Slide!

Нам снова разрешили использовать тепловую карту точек Strava для улучшения карты. Участник PangoSE из Швеции воспользовался лучшим способом для открытия данных с непонятным статусом: написал письмо с вопросом. И старший менеджер продукта Strava Metro ответил: мол, да, не видим в этом ничего плохого. Но есть ощущение, что и разрешение не то, и данные как-то уже не нужны.

Strava — это соцсеточка для фитнеса: выдаёт задания и отслеживает маршруты и показатели, позволяя хвастаться ими нажатием кнопки. С 2014 года часть карт на их сайте и в мобильных приложениях перешли на OSM. В то время в компании работал Пол Мак, автор многих гео-библиотек на Go, велосипедист и осмер. На SotM US в Вашингтоне он показал Strava Slide: форк редактора iD, который добавлял подложкой тепловую карту точек из велосипедных треков Strava и позволял одной кнопкой оформлять их в дороги для OpenStreetMap. Через пару дней Пол твитом разрешил рисовать карту по этому слою. Подложку добавили в JOSM и iD и начали по ней уточнять велодорожки и тропы в лесах.

После того, как в январе 2018 года студент австралийского университета нашёл на их карте маршруты пробежек вокруг военных баз по всему миру, Strava начала закручивать гайки. Помимо прочего, тепловая карта потеряла в детальности: огромные квадратики уже не помогали в уточнении OSM. Редактор Slide перестал работать, его подложка расплылась. Картографы не хотели терять такой источник информации: в отличие от осма с его двумястами треками в день, на карту Strava загружают двести тысяч велопоездок в день. Поэтому мы писали в компанию — но безответно. Неразмытые тепловые карты убрали из публичного доступа, пусть их и можно было достать, подставив регистрационные токены. Но молчание вкупе с закрытием означало, что разрешения на обводку в OpenStreetMap у нас нет. Если книгу, которую раньше можно было взять в библиотеке, спрятали на заднем дворе под замком, то наличие отмычки не даёт права её копировать.

16 ноября пятилетнее молчание прервалось: Родриго ответил, что они там все очень любят OSM. Сквозь телеграм-чатики, вики и почтовые рассылки пронеслось радостное письмо PangoSE, вики недвусмысленно говорит: «OpenStreetMap users have permission to use the data». Русскую вики-страницу летом полностью переписал участник PG7: на ней не только красочная история взаимодействия сообщества и компании, но и перечисление способов, как детальную тепловую карту подключить в JOSM и iD. Последние методы сводятся к подключению прокси-подложек с сервера Макса Кожина, про которые тот рассказал на хабре.

Проблема очевидна: разрешение-то где? Слова «мы не против» — лишь слова, пока не подкреплены делом. У нас нет однозначного «да, мы разрешаем». И у нас нет способа получить эти тайлы, не взламывая систему доступа и не нарушая условия использования, которые всё так же не упоминают OSM. Продолжая метафору выше, старший библиотекарь не против, что вы взломаете дверь, за которой книга, но само действие всё ещё противоправно. Об этом легко забыть, читая статью в нашей вики, написанную с позиции «что не запрещено — разрешено». Но по части лицензий многие осмеры стараются блюсти осторожность, запрещая использование источников с сомнительными условиями, типа русской кадастровой карты или панорам гугля. Другие картографы, вкусившие картографической свободы, бесятся от таких нелогичных на первый взгляд ограничений. Принцип «Нет значит нет» принимают не во всех культурах, и в России особенно. Что уж говорить про «отсутствие „да“ тоже значит нет».

Если в ближайшие месяцы (или годы, учитывая скорость реакции) обе проблемы решат, то у нас появится легальная подложка велотреков Strava. И возникнет следующий вопрос: а зачем? Ну, то есть, интересно посмотреть, где катаются велосипедисты, какие маршруты чаще выбирают. Но вы посмотрите на окрестности городов: за эти пять лет велосипедисты уже отметили всё что только можно. Они теперь планируют маршрут по карте OpenStreetMap, а не карта OSM рисуется по маршрутам их покатушек. Найти важную неотмеченную велодорожку, пользуясь тепловой картой, о-очень нетривиально. Это как искать пропущенную улицу в Нью-Йорке, пользуясь треками машин Juno. Она там есть, но спрятана среди десяти тысяч других улиц.

Чтобы тепловая карта Strava приносила пользу, а не лежала, спрятанная в подпапке «другое» меню слоёв JOSM, нужна автоматизация. Да, OpenStreetMap уже на том этапе развития, когда обклацывать подложки руками почти так же лениво, как обрабатывать обходные листы с прогулок. Есть же умный компьютер с нейросеточками — пусть он и работает. Дороги на снимках ищет фейсбуковский RapiD, пропущенные дороги и запреты поворотов отслеживают валидаторы. Пользу от стравовских треков принесёт только векторизатор в паре со сравнивалкой с OpenStreetMap. Или, хотя бы, достаточно мощный API, чтобы подобные инструменты мог написать кто-то другой. Но в свете продолжающегося закручивания гаек во второй половине этого года, оба исхода одинаково маловероятны.

Шесть-восемь лет мы радовались каждому источнику. Считали области, покрытые кадастровой картой. Внимательно следили за картой покрытия детальными снимками Bing и праздновали соглашение между Mapbox и DigitalGlobe. Источников было мало, а карту хотелось рисовать в каждом посёлке, поэтому мы хотели больше. Спутниковые слои были будущим OpenStreetMap. Новый слой значил новые покрытые города, что означало, что наши данные в этих городах смогут состязаться с народной картой, чьи картографы нежились на горах яндексовских снимков.

Теперь же нам, в общем, пофиг. Открыл редактор — выбирай из шести спутниковых слоёв со всемирным покрытием и ещё из нескольких региональных. Есть слой треков, есть Mapillary и OpenStreetCam, есть OpenAerialMap. Источников гора — а обрисовывают всё равно только Bing, который редактор iD показывает по умолчанию. Нам нечего желать: от «что бы обрисовать» мы дошли до «кто бы отрисовал». Мы очень остро почувствовали нехватку участников в OSM, и справляемся с ней по-разному. Кто-то ушёл в отрицание: мол, опытный участник лучше дюжины новичков, и уж точно лучше автоматики. Гуманитарная команда и другие организации собирают залы проектами навроде Missing Maps. Потом считают, сколько процентов пришли во второй раз (очень мало). Третьи поворачиваются к открытым данным.

Открытые данные и есть источник будущего для OpenStreetMap. Их не нужно обклацывать, разве что быстренько прощёлкать для проверки (сейчас как раз смотрят на театры в России). Данных много: одних только адресов проект OpenAddresses собрал полмиллиарда. Они не сильно конкурируют с обычными картографами: десять человек могут обклацать снимки целого региона, а вот объехать и собрать информацию о всех заправках или гипермаркетах будет сложнее. Сюда же можно добавить сотни миллионов распознанных нейросеточками домов. И, конечно, дороги и «зелёнка», время от времени появляющиеся в разных странах Европы и Северной Америки. Использование не подложек, но данных со стороны, — это и есть неминуемое будущее создания открытой карты. Поздно ругаться: почти все крупные компании, подсевшие на OSM, делают импорты разных видов, и пора перестать делать вид, что их нет.

Именно этого я бы ждал от Strava, если их гео-команда действительно заинтересована в улучшении OpenStreetMap. Не растрового слоя, а данных. Проект Strava Metro уже векторизует линии поездок для оценки и планирования транспортных сетей. Дело за малым: посмотреть, как эти транспортные сети обозначаются в OSM, совместить данные, найти промежутки, которые стоит заполнить. А дальше уже получить пользу от совмещения данных: например, используя данные о городах и туристической инфраструктуре, одной кнопкой строить потенциальные коридоры для региональных веломаршрутов. Главное — понимать, чем OpenStreetMap может помочь бизнесу, и принять его особенности. Из этого может родиться взаимополезный обмен данными. А без понимания мы имеем только скрытый слой разноцветных точек и редкие невнятные реплики от компании.

30 ноября   источники

Try rebooting your car

Месяц назад участник тесла-клуба Armee_1, недовольный тем, как его машина едет по парковке, замапил её в OpenStreetMap. Спустя некоторое время, он вызвал машину ко входу в гипермаркет, и — чудо из чудес — она поехала не в объезд, как раньше, а напрямую через парковку. Так обладатели Теслы узнали, что уточнять OSM полезно, а мы — что по нашим данным ездят автономные машины и не жалуются, что она не HD.

Водители не видят в Тесле OSM: на их приборной панели привычные карты от Google.
Это не изменилось с 2012 года, когда начались поставки Model S. Но внутри компания не раз меняла алгоритмы и данные. Тесла использует несколько карт: с июля 2017 года сервер, прокладывающий маршруты так, чтобы захватывать станции зарядки, работает на движке Valhalla от Mapbox. К апрелю 2018 года он научился учитывать пробки и, конечно, собирать треки автомобилей, чтобы эти пробки уточнять. Наконец, когда интернет недоступен, подключаются внутренние карты — которые до перехода на OSM скачивались целиком на всю страну, задерживая обновлением выезд из гаража.

Исследование автономности дало плоды покупателям Тесл: с конца сентября американцы могут нажать кнопку «призвать автомобиль», и он доедет от своего места на парковке до хозяина, прямо ко входу в магазин или фитнес-клуб. Кнопка работает только на парковках и только в радиусе семидесяти метров от машины. Не всегда маршруты были оптимальными, но главное — будущее для водителей наступило: в духе «Knight Rider», машина из куска железа стала подвижным помощником, подскакивающим по нажатию кнопки.

Над беспилотными автомобилями сейчас работают примерно все — включая Яндекс, Uber и Lyft. На хайпе выезжают картографы, во все свои сайты рекламируя «HD Maps»: суперточные карты, на которых размечен каждый булыжник в брусчатке и каждый люк, чтобы электронный водитель не столкнулся с сюрпризами. «Машина учтёт даже знак, закрытый снежной шапкой». Сантиметровая точность, каждая полоса отмечена. «Наши машины собирают лидаром данные в реальном времени, постоянно уточняя HD-карты». Дошло до того, что так назвали карты от Mapbox, после того, как компания анонсировала третью версию векторных тайлов, ныне забытую. Общий посыл — беспилотный автомобиль не работает без высокоточных карт.

И тут водители Тесл замечают: «о, я нарисовал линию в осме, и машина теперь едет по ней». Экспериментируя, Armee_1 отрисовал ещё несколько парковок — машина выбрала оптимальный маршрут уже на следующий день. Десятки водителей бросились изучать редактор iD, узнавая, что рисовать парковки в нём очень просто. Кто-то расстроился, что Тесла использует данные открытого проекта, подверженного вандализму. Кто-то ожидал, что компания сама разметит парковки по данным от автомобилей, а не будет ждать этого от водителей. Нашли на карте парковку у завода Теслы — разумеется, отрисованную в деталях. Эти детали — например, что машина объезжает отрисованные газоны — они использовали для улучшения своих парковок. В теме уже за двести сообщений, она полна счастливых людей, получивших больше контроля над своей машиной.

Получается, точность не нужна. Беспилотные машины становятся достаточно умны, чтобы ездить по километровке (картам масштаба 1 км в 1 см, для тех, кто не застал бумажные карты). Если знаешь азимут и видишь достаточно, чтобы найти себя на карте, то можешь добраться до финиша. Все эти полосы, светофоры, поребрики нужны только картоделам, чтобы занять картографов и делать перед другими вид, что они понимают, в чём будущее картографии. Сенсоры автомобилей уже достаточно развиты, чтобы строить HD-карту прямо в процессе движения и забывать через секунду. Качество карты не важно, важен контроль. И именно этого у OpenStreetMap в избытке. Не хватает только людей, которые популярно объяснят OSM людям, чтобы компании не скрывали источник данных, а открытия, подобные описанным, случались не внезапно.

Будущее райдшеринга — это автобус

На этой неделе компанию Juno, в которой я работаю, закрыли. Всех разработчиков взял к себе Lyft — другой американский райдшеринг. Раньше мы работали с одним Нью-Йорком, теперь наше поле работы — все Соединённые Штаты. Весёлые времена. Мне даже в штосм теперь нельзя писать — жду разрешения от команды Lyft. До тех пор текст пришлось удалить.

В чём же будущее?

23 ноября   ВНЕЗАПНО

Главный вопрос OpenStreetMap

Сейчас в Призрене, Косово, идёт конференция State of the Map SEE (юго-восточной Европы). Видеозаписей не будет: она по-настоящему локальная, для той пары сотен человек, кто понимает английский. После моего доклада появились несколько идей, которые стоило записать. Если хотите контекст — следите за телеграм-каналами @foss4g_ru и @shtosm.

Рассказал про OpenStreetMaps во множественном числе. Втопил за многоязычность и разнообразие среди участников — и понимание, что у нас не одна OpenStreetMap с единым всемирным сообществом, а тысяча отдельных OSM с тысячью маленьких и больших сообществ, у каждого из которых свои практики тегирования и мнения о полноте карты. Я не понимаю, как здесь, в Косово, отметят свои кебабные рестораны на карте их владельцы, когда они не могут даже узнать про OSM (сайт этой конференции — только на английском) и узнать его правила (перевода вики на албанский нет).

Сейчас с Феликсом классно обсудили эти наблюдения. Спросил у него про нападки на Missing Maps. Европейцы замечали, что от всей этой инициативы веет колониализмом: белые мужчины решают, как выглядеть карте Африки и Азии. С другой стороны, карта колониальна по своей природе: ты идёшь в соседний двор и решаешь, как ему выглядеть на карте, что должно там быть и что нет. Карта — это власть; нельзя делать карту и не иметь власти. Цель подобных конференций — поделиться этой властью, дать её как можно большему количеству людей.

Но, опять же, среди слушателей нет владельцев кебабных. Они не поймут доклады, хотя среди них есть очень доходчивые ликбезы, потому что они на английском. Нужно ли им это? Закрадывается странная мысль, что может, пусть они жарят свои кебабы, карта им ни к чему. Поэтому их нет в OSM. Это опасно походит на поверье десятилетней давности, что женщин в технических профессиях мало, потому что это не женское дело, это им не интересно. Стыдная мысль, даже писать её неловко.

Другое, о чём мы задумались, — OpenStreetMap как средство получения и передачи знаний. Ты не рисуешь домики, а узнаёшь, как устроена карта, как проекция влияет на прямоту углов, как спутниковые снимки соотносятся с картой. Ты получаешь важные знания и даже не обращаешь на это внимание. Потенциальные картографы в деревнях, охваченных Missing Maps, лишаются этого: всё нарисовано за них. Для компаний и кампаний OpenStreetMap — это данные. Нужно больше данных, нужны свежие данные. Но людям нужны не данные, а знания. Люди — особенно люди из далёких стран — предпочтут научиться, предпочтут освоить удочку, а не получить рыбу. Закрашивая карту из лучших побуждений, мы лишаем этих людей знания.

Важная часть обучения картографии — ошибки. Придя в проект, ты рисуешь кривые домики, выбираешь глупые теги (я помню про свои juridical_faces) и забываешь соединить улицы. Потом понимаешь, в чём ошибка. Придумываешь свои теги, обращаешь внимание на мелочи, которые не интересуют других: на полосы обгона, кусты вдоль дороги, люки. Быть в OpenStreetMap на заре его становления было классно: ты двигался наощупь и узнавал многое в процессе.

Сейчас если ты сделаешь ошибку, тебе в личку быстро придёт кто-то из сотни валидаторов и сообщит о ней. Может, даже отругает. Всё стандартизировано, везде валидаторы. Карту используют в Facebook, Mapbox, Microsoft, Apple. Она должна быть однообразна и корректна. У современных новичков в OSM нет права на ошибку. Они приходят и становятся частью даже не сообщества, а армии картографов, где всё должно быть ровно, параллельно и покрашено в уставные цвета. Из проекта уходит игра и приходят задачи. А игра — это лучший способ получить знания. Корпорации и опытные картографы лишают участников знаний в обмен на большие и качественные данные.

Непонятно, что с этим делать. Возможно, это лишь моментное чувство, а OpenStreetMap, как мы знаем, не оперирует моментом: на него нужно смотреть через десять, пятьдесят лет. ML и AI, которые никогда не приносят новых знаний, как пришли, так и уйдут. Может, мы поймём, что OSM идёт не туда, и сделаем альтернативу. Может, мы запретим массовые правки. Или запретим препятствовать им. В ближайшие годы нам придётся ответить, что такое OpenStreetMap. Данные или карта? Игровая площадка или галеры? Средство общения или проект? Польза или сообщество? Наш совместный ответ определит будущее проекта — и, конечно, оно не понравится никому в любом случае.

26 октября   ВНЕЗАПНО
Ранее Ctrl + ↓