Математик взломал сайт знакомств и нашёл девушку мечты

35-летнему математику Крису Маккинли (Chris McKinlay) из Калифорнийского университета в Лос-Анджелесе потребовалось всего 88 дней, чтобы осуществить дата-майнинг анкет на сайте знакомств и подобрать девушку, которая идеально подходит по характеру. Помог ему в этом доступ к суперкомпьютерам Калифорнийского университета, пишет Wired.

В июне 2012 года Маккинли работал над докторской диссертацией по обработке больших массивов данных и параллельным методам вычислений. В какой-то момент он решил отвлечься и зарегистрироваться на сайте знакомств OkCupid. Нужно заметить, что этот сайт основан гарвардскими студентами и использует хитрую систему вычисления совместимости между потенциальными партнёрами. Каждый из них отвечает на сотни вопросов о своём характере, привычках и предпочтениях. Вопросы самые разные: “Любите ли вы кошек?” (какие ответы вы приемлете от других), “Как часто вы используете Facebook?”, “Как долго планируете встречаться?” и т.д. После этого вы можете посмотреть, насколько тот или иной человек подходит вам. Система показывает вероятность успешных отношений, дружбы и вражды.

Логика в том, что чем больше партнёры похожи, тем лучше им будет друг с другом.

Хитрость в том, что посмотреть, как ответила девушка на определённый вопрос, можно только после того, как вы сами ответите на него. При этом максимальное количество для каждого участника ограничено 350 ответами, в то время как общий банк содержит тысячи вопросов. Другими словами, некоторые ответы девушек навсегда останутся для вас загадкой, а “рейтинг совместимости” может оказаться слегка неточным.

Маккинли нашёл всего лишь около 100 девушек, у которых показатель совместимости превышал 90%, но даже с ними свидания как-то не сложились (Криса хватило на шесть свиданий). И тогда парень придумал способ, как провести анализ по своим собственным правилам.

Крис создал 12 фейковых профилей, отвечая на вопросы случайным образом. После этого он смог получить доступ к полным профилям девушек со всеми ответами. За три недели дата-майнинга его система собрала 6 млн ответов от тестовой выборки из 20 тыс. анкет.

После фильтрации осталось 5000 девушек, которые живут в Лос-Анджелесе и Сан-Франциско и заходили на сайт в течение последнего месяца. Крис написал скрипт на Python для сортировки девушек с разными характеристиками на семь кластеров, вроде “Заботливые”, “Верующие”, “Татуировки” и т.д.

Два кластера он нашёл особенно интересными. В первом были девушке примерно 25 лет хиповатого стиля, музыканты и актрисы. Во второй кластер вошли более старшие девушки с креативными профессиями в литературе и дизайне. Так что Крис создал два своих профиля, чтобы сфокусироваться на каждом из этих кластеров - и ответил на 500 самых популярных вопросов в каждой из групп. Здесь уже Крис отвечал на вопросы честно, хотя слегка оптимизировал ответы в зависимости от кластера…

25 January 2014

95 процентов американских банкоматов работают на Windows XP
Закажи сайт и получи в подарок автомобиль LADA GRANTA

• подготовка к егэ »»»
егэ по русскому языку егэ по математике узнать результаты егэ
• Datejs или кому нужны календари »»»
Редкий сайт обходится без формы для какой либо даты. Часто нужно сохранить какое то событие, например день рождения, деловую встречу или любое другое число.
• Программист научил компьютеры отличать голых девушек от одетых »»»
Не нужно быть кандидатом наук, чтобы отличить голую девушку от одетой.
• Британские специалисты по компьютерным технологиям вычислили самый унылый день 20 века »»»
Таким днем было 11 апреля 1954 года, когда в мире не произошло никаких крупных событий.
• Построение XAML-интерфейса на основе ролей ASP.NET или RoleBased UI в XAML »»»
Если краткость - сестра таланта, то… Есть ASP.NET сайт, на сайте используются доступ к страница на основе ролей.