
Altaran
Модератор
Команда форума

В моем предыдущем посте в TikTok я обсуждал, почему его алгоритм For You Page - это соединительная ткань, которая заставляет TikTok работать. Это шина на материнской плате, которая соединяет и замыкает все контуры обратной связи.
Но в захватывающем дух стремлении понять, почему компании могут захотеть приобрести TikTok, если ByteDance будет вынужден отказаться от популярного приложения для коротких видео, шумиха вокруг его алгоритма приобрела некоторую экзотичность, что часто характеризует западный анализ китайских технологий сцена в наши дни.
В этом посте я хочу обсудить, как именно дизайн TikTok помогает его алгоритму работать так же хорошо, как и он. В прошлый раз я обсуждал, почему алгоритм FYP лежит в основе маховика TikTok, но если алгоритм окажется неэффективным, весь цикл обратной связи рухнет. Понимание того, как алгоритм достигает своей точности, имеет значение, даже если вас не интересует TikTok или короткое видео-пространство, потому что все больше и больше компаний во всех отраслях будут сталкиваться с конкурентом, преимущество которого сосредоточено вокруг алгоритма машинного обучения.
Я хочу обсудить, как дизайн TikTok помогает его алгоритму «видеть».
«Видеть как государство » Джеймса С. Скотта - одна из тех книг, которые превращают вас в одного из тех типов Кремниевой долины, которые используют (злоупотребляют?) Термином разборчивость. Я впервые услышал об этом после того, как прочитал краткое изложение основных тем Венкатеша Рао , и этот отрывок остается хорошим учебным пособием по книге, если вы не планируете читать текст ( обзор книги Скоттом Александером тоже хорош, хотя и достаточно длинный. что это могло почти оправдать собственный TLDR). Однако я рекомендую вам это сделать.
Подзаголовок книги Скотта: «Как не удалось добиться успеха в определенных схемах улучшения условий жизни человека». В частности, Скотт анализирует состояние отказа, которое повторяется во многих областях, в которых руководящий орган, такой как национальное государство, обращается к тому, что Скотт называет высоким модернизмом, в попытке повысить четкость того, что они пытаются контролировать. , будь то для целей налогообложения, призыва или любого количества целей. Поступая так, они навязывают ложное чувство порядка более сложной реальности, чем они могут представить.
Это книга, повышающая осведомленность о всевозможных примерах непредвиденных последствий в повседневной жизни. Мы все могли бы использовать более здоровые проявления смирения, когда мы слишком увлечены высокомерием человека. Мир богаче и сложнее, чем мы думаем.
Например, многое из того, что обсуждает Скотт, имеет отношение к гордыне наших современных гигантов социальных сетей. Эти доминирующие приложения разработаны для повышения читабельности баз пользователей, среди прочего, для стимулирования взаимодействия, предотвращения оттока пользователей и, в конечном итоге, для обслуживания целевой рекламы. Это, в свою очередь, привело их материнские компании в чащу проблем, с которыми они сейчас постоянно борются.
Но это тема для другого поста, в другой день. В то время как Скотт сосредотачивается на том, как национальное государство использует упрощающие абстракции, чтобы «видеть» своих граждан на синоптическом уровне, я хочу обсудить, как дизайн приложения TikTok позволяет его алгоритму «видеть» все детали, необходимые для эффективного выполнения своей работы по подбору игроков. и точно. Если Seeing Like a State посвящен общему состоянию отказа, этот пост посвящен новой модели, позволяющей максимально эффективно использовать алгоритмы машинного обучения при разработке приложений и сервисов.
В последние годы одна из реализаций машинного обучения, по крайней мере для стороннего наблюдателя, такого как я, заключается в том, насколько большой прогресс стал возможен только за счет увеличения объема обучающих данных на несколько порядков. То есть, даже если сами алгоритмы не сильно отличаются от тех, что были несколько лет назад, просто обучая их на гораздо более крупных наборах данных, исследователи ИИ достигли таких прорывов, как GPT-3 (который временно довел технический Twitter до тантрического оргазма). .
Когда люди говорят, что алгоритмы TikTok являются ключом к его успеху, многие представляют некий волшебный блок кода как секретный соус компании. Современный русский писатель-постмодернист Виктор Пелевин сказал, что главный герой всего современного кино - это портфель, полный денег. От кейса с радиоактивным материалом (я думаю, что это было?) В Kiss Me Deadly до портфеля с таким же сиянием, кто знает что (душа Марцелла Уоллеса?) В Криминальном чтиве , от уравнения Генезиса в Формуле до секретного финансового процесса в " Испанском пленнике" Дэвида МаметаМы давно в кино были одержимы волшебным МакГаффином. В последние недели обсуждение алгоритма TikTok подняло его до уровня чего-то похожего, сродни одному из тех мистических археологических артефактов в одном из фильмов об Индиане Джонсе, таких как Ковчег Завета, Святой Грааль или лингам Шивлинг.
Но большинство экспертов в этой области сомневаются, что TikTok добился ранее неизвестного прогресса в алгоритмах рекомендаций машинного обучения. Фактически, большинство из них сказали бы, что TikTok, вероятно, строит те же стандартные подходы к проблеме, что и другие.
Но помните, что эффективность алгоритма машинного обучения зависит не только от самого алгоритма, но и от алгоритма после обучения на некотором наборе данных . GPT-3, возможно, и не новинка, но он обучен на огромном объеме данных и с огромным количеством параметров, его результаты часто удивительны.
Точно так же алгоритм TikTok FYP, обученный на его наборе данных, удивительно точен и эффективен в сопоставлении видео с теми, кто находит их интересными (и, что не менее важно, в подавлении распространения видео среди тех, кто не считает их интересными). .