9 июн. 2008 г.

True Knowledge — технология истинных знаний

«True Knowledge» — название компании, специализирующейся на поиске информации в Интернете. Расположена она в английском городе Кембридж.
Ниже представляю перевод информации с официального сайта. На мой взгляд технологии довольно интересные:
«С помощью наших технологий мы стараемся решить одну из фундаментальных проблем, связанную с поиском в сети Интернет, которая заключается в том, что компьютеры (в отличие от людей) не могут понимать содержимое веб-страниц. В результате, процесс поиска информации в начале 21 века до сих пор требует от пользователя умения подбирать особые ключевые слова в надежде обнаружить их на нужной странице и рассчитывать на то, что поисковая система поместит искомый документ с желаемой информацией в первые строчки списка результатов. Элементарный запрос поисковой системе в большинстве случаев не гарантирует получения удовлетворительного ответа.
Наша технология идет в обход этой проблемы путем изменения формы информации, понятной человеку, на ту, которую компьютеры способны распознавать и обрабатывать, при этом она работает так, что рядовые пользователи могут пользоваться ею, не изучая принципов ее работы.
Поскольку информация, хранящаяся при помощи такой технологии, может быть понята и обработана компьютерами, становится возможно задавать прямые вопросы и получать на них не менее прямые ответы. Более того, наша технология предоставляет место в Интернете, где компьютеры и другие автоматизированные системы смогут запрашивать сколь угодно большой объем информации и получать результат в той форме, которую они способны прочесть и обработать.

Наши основные продукты:
  • сайт, созданный по подобию поисковой системы, который может выдавать ответы на вопросы, может быть использован в качестве платформы для добавления информации или же в качестве традиционной поисковой системы;
  • API-приложение для создания генерируемых компьютером запросов.
Находясь на начальной стадии, мы запустили пробную версию нашего сайта и в настоящее время предоставляем доступ бета-тестерам. В ближайшее время планируется открытие доступа бета-тестерам для нашего API-приложения.

Технология

По существу, мы создали технологию, которая представляет мировые знания в форме, ясной и доступной для человека, а также понятной для компьютера. В этом состоит отличие от тех данных, которые хранятся на веб-сайтах и в книгах, написанных на естественном языке, понятном человеку, но не доступном для компьютера.
Из-за большого различия, трудно описать технологию прямым сопоставлением ее с другой системой. Вместо этого есть несколько надежных методов изучить ее, включая:
Сайт вопросов и ответов (Question-Answering Site).
Что следует знать о нашей технологии: это веб-сайт, на котором вы можете задать вопросы касательно любой темы и получить прямой ответ. В отличие от Q&A-сайтов, рассчитанных на человека, вам не нужно ждать, пока кто-нибудь ответит. На ваш вопрос отвечает компьютер, используя при этом знания, хранящиеся в понятной для него форме, то есть не просто механически выдавая текст, который не понимает. Поэтому система может ответить на вопросы, которые задаются впервые, и может комбинировать знания через механизм логического вывода и перекрестные ссылки на хранящуюся в базе информацию, выдавая обоснованный ответ.
Механизм расширенного поиска
Что еще характерно для нашей технологии - это значительно усовершенствованная система поиска. Вы можете пользоваться нашим сайтом также, как и предыдущей поисковой системой, но в дополнение к списку документов, ваш запрос также просканирует наша технология - если мы можем предоставить более прямой ответ на ваш запрос, мы это сделаем. Ваш запрос может представлять собой стандартный вопрос, но даже если это не так, мы, возможно, сможем определить, что вы ищете, и дадим вам прямой ответ в верхней части экрана. Благодаря тому, как оцениваются данные, вы можете быть уверены в верности той информации, которую мы отыскиваем (в отличие от информации с какой-либо веб-страницы).
Используя нашу технологию вопросов и ответов, мы также можем интерпретировать 2-3 типичных слова, если поиск идет по ключевым словам, которые часто вводят в строку поиска в качестве вопроса, и выдать подходящий ответ. То, что напечатано, и то, где это напечатано, - это просто название объекта поиска. Наша технология позволяет вывести небольшой экран с ключевой информацией о запросе (подобно результатам поисковой системы). Этот экран содержит информацию из нашей базы знаний, которая определяется тем, что пользователь ввел в строку поиска. Например, бизнес-экран может содержать контактную информацию и адрес официального сайта организации (смотрите примеры на скриншотах).
“Wikipedia”
В нашей системе используется два основных источника информации: данные, импортированные нами, и данные, добавленные такими же пользователями, как вы. Значительную часть нашей технологии составляет возможность добавления информации пользователями даже при отсутствии с их стороны какого-либо технического понимания основных компьютерных процессов.
Главное отличие нашей технологии от сайтов, подобных Wikipedia, заключается в том, что их пользователи создают и редактируют документы на естественном языке, у нас же информация представлена в виде дискретных данных. В отличие от естественного языка, эти данные содержатся в форме, доступной для понимания и обработки компьютером.
Одно из преимуществ понимания компьютером данных, которые в нем содержатся, - качество информации. В нашей системе, после того, как какой-либо факт установлен при достаточных на то основаниях, изменить его нелегко. Более того, данные, противоречащие этому факту, автоматически предупреждаются. В случае с Wikipedia, когда кто-то злоумышленно или неверно редактирует страницу, единственный выход - если кто-то другой вернет все обратно. Любая из просматриваемых страниц - это мнение последнего из тех, кто вносил изменения.
Универсальная база данных
В случае обычного приложения с базой данных разработчики создают схему - ряд связанных таблиц и полей данных, содержащих нужную информацию. Затем они пишут код, который управляет и обрабатывает данные в этой схеме. Когда приложение закончено, этим кодом управляют пользователи. Знания, которые способна обработать система, очень ограничены и таковыми остаются, поскольку размер приложения после его запуска изменить нельзя. Пользователи могут добавлять информацию в таблицы, но схема остается неизменной.
Наша технология подобна приложению с базой данных, но все в ней направлено на расширение пользователями. Объем знаний, который может хранить система, увеличивается каждый раз, когда пользователь добавляет новые класс, связь или атрибут. Информация о любом мылимом предмете может быть добавлена в нашу систему и использоваться для ответа на вопросы.
Платформа для построения информационных сервисов
Каждое из когда-либо написанных приложений с базой данных вначале “ничего не знала”.
Таким образом, построение информационного сервиса требует многих часов усердной работы по созданию и наполнению таблиц данных и написанию программного обеспечения для управления и представления этих таблиц. Подобные системы нужно “обучить” всему, начиная с нуля, и в конце они знают очень немного: в них содержится только ограниченная информация, введенная разработчиками.
Построение сервиса данных в нашей системе отличается. Система уже знает очень много. Новые сервисы могут быть построены на этой основе, к тому же часто для этого можно использовать имеющиеся данные. При этом в значительной степени сокращается период внедрения и в, конечном счете, повышается качество сервиса.
Мы наблюдаем это каждый день, добавляя сервисы в нашу систему.

Архитектура



В основе системы лежит База Знаний (Knowledge Base) - огромная база данных по любой теме, представленных в форме, позволяющей их компьютерную обработку. Данные также логически выводятся Генератором Знаний (Knowledge Generator), используя данные Базы Знаний или произведенные данные, либо используя внешние источники знаний.
Пользователи могут задавать вопросы через интерфейс браузера (browser interface). Эти вопросы переводятся посредством Естественно-Языкового Интерфейса (Natural Language Translation) в запросы, выраженные на Языке Запроса (Query language). Наша технология включает методы, позволяющие устранить неоднозначность двусмысленных вопросов, в том числе их маловероятные интерпретации. Вопросы также могут быть сокращены до 2-3 слов и все равно остаться понятными - подобно обычному поиску по ключевым словам.
Для ответа на запросы Система Вопросов/Ответов (Query/Answer System) использует базу знаний и произведенные данные. Программный интерфейс приложения (API) предоставляет Cистеме Вопросов/Ответов альтернативный интерфейс от удаленных компьютеров.
Оценка Системы (System Assessment) далее обрабатывет существующие факты, чтобы сохранить семантическую целостность. Например, данные могут быть отмечены как ложные, если они противоречат другим данным. Интерфейс браузера предоставляет пользователям возможность оценить истинность данных (User Assessment), позволяя им подтвердить или опровергнуть определенные данные. Репутация и история пользователя учитывается при автоматической оценке полученной от него информации. Вместе с оценкой системы это предупреждает часто возникающие на Wiki непоследовательные споры.
База Знаний расширяется за счет Добавления Данных (Knowledge Addition) пользователями через интерфейс браузера, либо за счет данных из Других Источников (Other Sources) в большом объеме.
Ключевым в иерархии является то, что все компоненты системы доступны для расширения пользователями. Кроме данных, пользователи могут также расширять вопросы, которые могут быть распространены на все новые области, и даже принимать новые правила “умозаключений” (включая исполняемый код, когда требуются вычисления) для Генератора Знаний (Knowledge Generator).»

1 комментарий:

Анонимный комментирует...

я зарегился в этой системе, наивно полагая, что там есть русский язык, а его там нет. Почему сайт не переводят?

Присоединяйтесь к нам на Facebook!

Последние заметки