Судебных следователей прибыть на место преступления в поисках улик. Нет подозреваемых, и каждый второй, который проходит, тем больше времени для след стынет. Образец ДНК было обнаружено, собрал, а потом отправили в соседний лаборатории судебной экспертизы. Там, он применяется и кормить в программу, которая сравнивает своего генетического содержания в ДНК хранится в Национальном ФБР система индекса ДНК (Инд) — база данных, содержащая профили из 18 миллионов человек, которые прошли через систему уголовного правосудия. Мы надеемся, что образец месте преступления будет соответствовать профилю из базы данных, указывая путь к подозреваемому. Образец также может быть использован для анализа родства, через который образец связаны с кровными родственниками, как это было сделано в апреле прошлого года, чтобы поймать пресловутый Голден Стэйт убийца.
Экспертиза ДНК является мощным инструментом, но это представляет проблему вычислительное масштабирование, когда он совершенствуется и расширяется для сложных образцов (содержащих ДНК из более чем одного человека) и анализа родства. Рассмотрим объем данных, что ФБР должен обрабатывать для нации. “Если вы считаете всех полицейских участках по всей стране, во всех операционных каждую неделю, это много данных, чтобы отслеживать и организовывать”, — говорит Даррелл Ricke от биотехнических систем и технологий. Чтобы поставить это в перспективе, если каждое государство сравнивает 2000 образцов на месте преступления раз в неделю, это 100 000 экземпляров для сравнения с 18 млн. анкет в неделю.
Ricke является частью команды, в лаборатории, которая разработала интегрированную веб-платформу под названием IdPrism, который предоставляет расширенные возможности сравнения без ущерба для скорости или функциональности. IdPrism позволяет выявить более 10 человек в сложных образцов ДНК, а также результатов расширенного родства. В его основе лежат два алгоритма, которые Ricke разработаны, FastID и TachysSTR, которые кодируют генетические маркеры как биты (0 или 1) и работают быстро и плавно. Эти алгоритмы недавно выиграла 2018 R и D 100 Award, которая вручается ежегодно журнал R&D в 100 самых значимых изобретений года.
Эти маркеры являются два вида вариаций в ДНК, называемые короткие тандемные повторы (str) и однонуклеотидные полиморфизмы (SNP). Они считаются своего рода ДНК, которые могут быть использованы для идентификации лиц, а также их родственников. Каждый человек обладает уникальным сочетанием СНП или ул. вариаций — один человек это комбинация представлена по определенной схеме, в то время как другого человека представлена в различных формах. Когда аналитики запустить с места преступления образцов ДНК на профиль в базе данных Инд, найти подходящую комбинацию из этих сообщений показывает высокий шанс, что ДНК принадлежит одному человеку.
ФБР в настоящее время использует программные алгоритмы, которые должны пройти через сложный комплекс расчетов, чтобы выявить, если образец совпадает с профилем. Алгоритмы Ricke назначить немного значений к нормальным (0) или редких (1) версий ОП, или немного для каждого отдельного ул. маркером. На обычной этикетке указано, что или ул. СНП является общим для многих людей и это не уникальный маркер, который может быть использован для идентификации личности. С этой цифровой ДНК, кодирующую для сравнения идентичности и сложные смеси, анализ может быть сделано с помощью всего трех аппаратных разрядные инструкции: исключающее или, логическое И, и населения.
Эксклюзивный или инструкция позволяет провести сравнение того, образцы ДНК могут быть одинаковыми или разными. Для судебной экспертизы, данная инструкция будет выводить 0, Если или ул. SNP в пример матчи, в профиль, и он будет выводить 1, если они не совпадают. Эта техника хорошо работает, когда образец места преступления содержится ДНК только одного человека, но если будет больше участников, соответствующий результат мог быть спрятан среди несовпадений с другими людьми в одной и той же пробе. Эта проблема решается путем добавления логических и с профилем базы данных результатов исключающее ИЛИ. Этот шаг, в некотором смысле, избавляется от несоответствия шума, чтобы выявить, является ли профиль базы данных сопоставляется с физическим лицом в образец. Последним шагом является численность населения, которая суммирует все для 1С. В итоге, матч представлен в основном 0С и несоответствие будет иметь большое число 1С.
Используя эти три аппаратные разрядные инструкции, алгоритм FastID можете сравнить 5,000 ОП в месте преступления образцы ДНК против 20 миллионов опорных профилей в возрасте до 12 секунд. Альтернативные методы может занять несколько часов, чтобы сделать это в таком масштабе. Аналогично, TachysSTR можете сравнить ДПС в 1 млн. образцов в 1,8 секунды, тогда как существующие алгоритмы занять 10 минут, чтобы сделать то же самое.
Результаты отображаются в системе IdPrism, в которых следователи могут работать, просматривать, запрашивать и хранить свои данные сравнения ДНК. Кроме того, чтобы быть быстрым и удобным, эта система позволила повысить точность судебно-медицинской экспертизы, включая панель 2,650 SNP маркерам, которые используются для сложных образцов и анализа родства.
В ноябре прошлого года система была переведена в пользователи за пределами лаборатории. «Хотя IdPrism к переходу-готовый продукт был сложным, это является удивительным, чтобы думать, что наши технологии используются», — говорит Филипп Фремонт-Смит, также из биотехнических систем и технологий группы и был причастен к биоинформатике сторона проекта.
“Когда Голливуд узнает об этом, они будут менять свои сценарии,” Ricke говорит. “Возможности настолько отличается от того, что там”.