April 16th, 2020

женя

Big data и с чем её едят

Коллега раньше работал программистом в страховой компании. Один из проектов был - рассылка потенциальным клиентам предложений об "очень выгодной" медицинской страховке. Базы адресатов добывались разнообразными и не всегда легальными путями, и надо было эти базы как-то между собой сопоставить, чтобы не задалбывать людей десятком одинаковых писем, не писать на адрес, с которого человек давно уехал, и в то же время никого не пропустить. Ну и сопоставляли по множеству критериев: фамилия, имя, дата рождения, номера телефонов, номер социального страхования (редко в каких базах есть), даты обращений к врачам и прививок (а этого добра хватало, базы в основном медицинские) и так далее. Типа если 25 параметров из 40 совпадает, то это тот же самый человек, а если только 24, то скорее всего разные.
Однажды к нашему Джону приходит бизнес-аналитик и говорит: Collapse )