Реферат по информатике на тему: “Информационно-поисковая система”

Простейшая информационно-поисковая система

Информационно-поисковая система как сложный механизм, функционирование которого является секретом фирмы. Понятие информационных поисковых систем, их значение и структура. Русскоязычные поисковые системы. Конкуренция между поисковиками, лидерами рынка.

Рубрика Программирование, компьютеры и кибернетика
Вид реферат
Язык русский
Дата добавления 04.01.2016
Размер файла 19,4 K
  • посмотреть текст работы
  • скачать работу можно здесь
  • полная информация о работе
  • весь список подобных работ

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Министерство образования и науки Астраханской области

ОАОУ СПО Астраханский социально-педагогический колледж

Специальность 39.02.01 «Социальная работа»

РЕФЕРАТ

на тему: « Простейшая информационно-поисковая система»

Выполнила: студентка 1 «С» группы

поисковик механизм конкуренция

1. Понятие информационных поисковых систем

2. Значение и структура

3. Русскоязычные поисковые системы

4. Популярные поисковые системы

5. История создания Google

6. История создания Яндекс

Введение

На сегодняшний день интернет стал неотъемлемой частью нашей жизни. Каждый день каждый из нас пользуется им, имея определенные цели. Все-от мала до велика, являются пользователями интернета. Обычным явлением в нашей жизни стал поиск в интернете нужной информации. Погода, карты, учебные пособия, музыка, рецепты и т.д. Наша жизнь стала проще. Мы можем заказать и оплатить билеты, продукты, технику, одежду, посуду, не выходя из дома. Задумывались ли Вы, что стоит за этой чудо-машиной, которая выдаёт Вам нужную информацию? За считанные секунды на экране Вашего компьютера, телефона, планшета появляется целый список интересующей Вас информации. Сейчас поисковые системы все больше стараются «видеть» сайт именно глазами рядового посетителя, чтобы результат устроил пользователя. Что же такое информационно-поисковая система (далее ИПС)? Какая ИПС самая популярная? Что чаще всего ищут пользователи?

Пользователи привыкли, что поиск данных является бесплатным. Однако в то же самое время ИПС является одним из наиболее эффективных бизнес-инструментов. Поисковый сервис – это предприятие, цель которого-получение прибыли. Чем больше людей пользуется данным поиском, тем больше мест для рекламы он можно продать. Именно поэтому между поисковиками существует конкуренция. Для того, чтобы удержать пользователей, необходимо постоянно улучшать результаты поиска, строить качественную актуальную выдачу, а также предоставлять дополнительные услуги – игры, сервисы, приложения. ИПС уже прочно обосновались в наших жизнях.

Изучая интересы пользователей с помощью дополнительных сервисов, поисковая машина и, как следствие, рекламодатели получают весьма точный «социальный портрет» аудитории. Эти сведения позволяют заметно увеличить эффективность размещаемой рекламы за счет актуального рекламного сообщения для конкретного человека.

Информационно-поисковые системы совершенствуются постоянно. Это обусловлено стремлением учесть особенности человеческого поведения, чтобы сделать выдачу для каждого посетителя уникальной. Теперь в механизмы обработки и поиска информации все чаще включаются технологии искусственного интеллекта, построенные на новейших вычислительных методах.

1. Понятие информационных поисковых систем

Понятие современной информационно-поисковой системы составляет сложный комплекс, подразумевающий программно-аппаратные механизмы с веб-интерфейсом. Их работа держится в тайне компанией разработчика. Благодаря определенным алгоритмам действий специальные роботы, предназначенные для поиска, собирают информацию (заносят ее в базу данных, где она структурируется и располагается в определенном порядке). Запрос, записанный в поисковой строке пользователем, направляется к базе данных. Далее системы, осуществив отбор нужной информации, выдает список ссылок на сайты, удовлетворяющие данный запрос. Сортировка данных производится по их значимости для удобства пользователя.

В середине 1990-х годов появились первые ИПС. Они были похожи на предметный указатель в обычных книгах. В базе данных ИПС хранились ключевые слова, собранные со страниц сотен сайтов. Поиск данных происходил исключительно по этим ключевым словам. Немного позднее был создан и разработан полнотекстовый поиск, значительно облегчающий поиск нужной информации. Каждое слово(фраза) фиксировалось в индексе поисковой системе. Благодаря этому, стал возможен поиск по любым словам и их сочетаниям.

Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, который создавал «World Wide Web Wanderer» — бот, разработанный Мэтью Грэем из Массачусетского технологического института в1993. В том же 1993 году появилась поисковая система «Aliweb», которая работает до сих пор. Первой полнотекстовой поисковой системой была «WebCrawler», начавшая свою работу в 1994. Её преимущество заключалось в том, что она давала возможность пользователям искать нужные данные по любым ключевым словам на любой веб-странице. С тех пор это является стандартом во всех ИПС. Более того, «WebCrawler» стал первым информационным поиском, известным в широких кругах. Более того, это был первый поисковик, о котором было известно в широких кругах. В 1994 был запущен «Lycos», разработанный в университете Карнеги Мелона.

Через некоторое время появилось множество ИПС, конкурирующих между собой- «Excite», «Infoseek», «Inktomi», «Northern Light» и «AltaVista». В некотором смысле они конкурировали с популярными интернет-каталогами, такими, как «Yahoo!». В 1996 году русскоязычные пользователи интернета получили доступ к морфологическому расширению поисковой машины Altavista, и к оригинальным российским поисковым машинам «Рамблер» и «Апорт». 23 сентября 1997 была открыта поисковая машина Яндекс, ставшая популярнейшей среди русскоязычных пользователей.

2. Значение и структура

Работа поискового сервера достаточно сложна, но постараемся разобраться в ее структуре. Изначально специальная программа («паук») постоянно просматривает web-страницы и по базовым словам составляет базы данных индексов. Web-сервер формирует пользовательский запрос на поиск информации и передает его специальной программе – «поисковой машине». Она, в свою очередь, изучает базу данных, формирует список страниц, удовлетворяющих условиям запроса, и возвращает его web-серверу. Web-сервер оформляет результаты запроса, удовлетворяющие пользователя, и предает их на компьютер пользователя.

Информационно-поисковая система – система, выполняющая функции:

– хранения больших объемов информации;

– быстрого поиска требуемой информации;

– добавления, удаления и изменения хранимой информации;

– вывода информации в удобном для человека виде.

– документальные и фактографические информационно-поисковые системы.

Зачастую мы не всегда можем удачно сформулировать наш запрос. Существует технология эффективного поиска в интернете. Познакомимся с ней подробнее. Чтобы правильно и грамотно сформулировать свой запрос на поиск информации, нужно выполнить некоторые критерии. Но всё же это не главный ключ успеха. ИПС должна удовлетворять некоторые критерии:

– полнота охвата информационного поля, в котором поиск происходит;

– достоверность полученного результата;

– скорость получения результата.

3. Русскоязычные поисковые системы

Большинство «русскоязычных» информационно-поисковых систем осуществляют поиск на многих языках — английском, белорусском, украинском и др.

Читайте также:
Расширение файла - что это, какие бывают, как найти, настроить

Русскоязычные поисковики отличаются от «всеязычных» информационно-поисковых систем, которые индексируют все документы подряд, тем, что индуцируют в основном лишь ресурсы информации, расположенные в доменных зонах, где преобладает русский язык. Некоторые русскоязычные ИПС ограничивают другими способами своих роботов, отвечающих за функционирование информационно-поисковой системы.

Реферат по информатике на тему: “Информационно-поисковая система”

Код ОГЭ по информатике: 2.4.1. Компьютерные энциклопедии и справочники; информация в компьютерных сетях, некомпьютерных источниках информации. Компьютерные и некомпьютерные каталоги, поисковые машины, формулирование запросов

Поиск информации (информационный поиск) — это информационный процесс, цель которого — получение информации из информационного объекта или из хранилища информационных объектов. Поиск информации является разновидностью процесса обработки информации. Для ускорения информационного поиска создают и используют информационно-поисковые системы.

Информационно-поисковая система (ИПС) — система, выполняющая функции хранения больших объёмов информации, быстрого поиска требуемой информации и её вывода в удобном для человека виде.

Информационно-поисковые системы позволяют добавлять, удалять и изменять хранимую информацию. Существуют информационно-поисковые системы двух видов:

  • документальные (в результате поиска выдаётся документ);
  • справочные (в результате поиска информация предъявляется или сообщается).

Справочные ИПС, в свою очередь, делятся на:

  • фактографические (в результате поиска предъявляется искомая информация, факт);
  • адресные (в результате поиска предъявляется адрес, где информация хранится).

Документальные и фактографические ИПС. Документальными ИПС являются книжные фонды, открытые для доступа в читальных залах библиотек или в магазинах. Однотипные информационные объекты (книги) стоят на стеллажах чаще всего в порядке отраслей знаний (философия, математика, физика и т. п.). Читатель (покупатель), проходя вдоль стеллажей, ищет сначала названия отраслей знаний, а затем книги в разделах.

В словарях однотипные информационные объекты (слова и связанные с ними описания) расположены в алфавитном порядке, что существенно ускоряет поиск нужного слова или словосочетания. В энциклопедиях в аналогичном порядке расположены другие однотипные информационные объекты — статьи с описанием понятий. По такому же принципу организованы алфавитные книжки для записи телефонов и адресов, а также список учеников класса в классном журнале.

В другом порядке — хронологическом — организованы фактографические ИПС, которые называются расписаниями. Имеются в виду расписания занятий, расписания движения поездов, самолётов и т. п.

Адресные ИПС в документах. Адресные ИПС распространены гораздо шире документальных и фактографических. Каждый бумажный документ, исключая словари и энциклопедии, имеет собственную адресную ИПС в виде оглавления (содержания). В оглавлении записаны названия разделов документа и указаны их адреса — номера страниц, на которых эти названия находятся.

Поиск информации в документе состоит из трёх этапов:

  • поиск в оглавлении подходящего названия раздела с адресом (номером страницы);
  • поиск в документе страницы по адресу (номеру);
  • поиск информации в разделе.

Адресные ИПС в хранилищах информационных объектов. В хранилищах бумажных документов (библиотеках, архивах) создаются адресные ИПС, которые называются каталогами.

Традиционные каталоги содержат бумажные карточки с описаниями документов и их адресов в хранилище (номер хранилища, номер стеллажа и т. д.). Адрес документа в хранилище называется шифром. Аналогичным образом организуется хранение и адресация звуко-, кино- и видеозаписей.

Поиск информации в хранилище информационных объектов состоит также из трёх этапов:

  • поиск в каталоге карточки подходящего информационного объекта с адресом (шифром);
  • поиск в хранилище информационного объекта по адресу (шифру);
  • поиск информации в информационном объекте.

Оценка результатов поиска информации. Поиск информации в информационных объектах или в хранилищах информационных объектов редко бывает однократным. Результат поиска всегда оценивается с точки зрения полноты требуемой информации. Если информации недостаточно, поиск других источников информации проводят снова и снова, пока результат не станет удовлетворительным.

Поиск внутри компьютера

Для поиска файлов и папок в компьютере используют поле поиска в меню кнопки Пуск или в окне программы «Проводник». В программе «Проводник» это делать удобнее, так как можно сузить область поиска. Для этого в «Проводнике» открывают папку, в которой предположительно содержится искомый файл или папка.

Для запуска процесса поиска в поле поиска вводят символы из имени файла или его содержимого. В области просмотра появляется список файлов и папок, которые отвечают запросу. В строке каждого файла указан реальный путь к нему.

Условия поиска можно сохранить, используя кнопку Сохранить условия поиска на панели в верхней части области просмотра программы «Проводник».

Список с результатами поиска анализируется пользователем самостоятельно. Одно можно сказать точно: если файл на самом деле находится в компьютере, то его имя непременно окажется в списке результатов поиска.

Чтобы просмотреть файл в содержащей его папке, по строке файла щёлкают левой, потом правой клавишей мыши, а затем в контекстном меню щёлкают по пункту Расположение файла. В области просмотра открывается папка, содержащая файл.

Поиск в Интернете

Существует несколько сайтов, которые представляют в Интернете поисковые системы (поисковые машины), в том числе русскоязычные:

  • yandex.ru
  • rambler.ru
  • www.google.ru
  • yahoo.com
  • go.mail.ru
  • bing.com

Поисковые системы представляют собой адресные информационно-поисковые системы. Они обычно включают два компонента:

  • базу рефератов электронных документов, которые размещены на серверах Интернета, вместе с гиперссылками на эти документы;
  • поисковый механизм, который позволяет автоматически по запросу найти информацию в этой базе данных (базе рефератов).

Процедура поиска информации. Для проведения автоматического поиска вводят текстовый запрос в поле поиска поисковой системы.

В поле поиска обычно вводят ключевые слова, которые отражают суть запроса, например «тезаурус». Запрос можно также сформулировать в виде вопроса, например: «Что такое тезаурус?». Поисковая система при этом игнорирует орфографические ошибки:

По умолчанию поисковые системы настроены на поиск в Интернете веб-страниц, которые содержат ключевые слова. Иногда требуется сузить область поиска, чтобы, например, найти новостную страницу или страницу-словарь, либо изменить объект поиска, чтобы, например, найти картинку, музыку, видео.

Для выбора объекта и области поиска поисковые системы в Интернете предлагают меню. После ввода данных щёлкают по кнопке Найти (или аналогичной). Через некоторое время окно браузера обновляется и в нём появляются результаты поиска в виде списка гиперссылок на документы. Этот список может содержать тысячи гиперссылок. По первой двадцатке списка всегда видно, точным ли был запрос. Иногда запрос следует уточнить и запустить поисковую систему ещё раз. В любом случае для получения ответа достаточно просмотреть первую сотню документов, обращаясь к ним с помощью гиперссылок из списка.

Поисковые каталоги. Многие поисковые системы на своих веб-страницах имеют поисковые каталоги, которые построены в виде меню, пунктами которого являются разделы каталога. Принцип построения поисковых каталогов аналогичен принципу построения дерева папок в компьютере. Выбор пункта каталога открывает новое меню, в котором также делают выбор. И так до тех пор, пока на экран не будет выведен список ссылок, входящих в конечный пункт каталога. В процессе поиска следует только правильно определяться с выбором пунктов каталога.

Читайте также:
Как включить ПК - различные способы и последовательность действий читать онлайн

Сохранение информации из Интернета. Просмотр веб-страниц может сопровождаться сохранением информации с этих страниц.

Если сохранения требует вся веб-страница, находящаяся в браузере, то вводят команду меню Файл|Сохранить как. Появляется диалоговое окно сохранения. В поле «Тип файла» выбирают уровень полноты сохранения — полностью веб-страница с включением графики, файл веб-страницы без графики или только текст веб-страницы. Операцию заканчивают щелчком по кнопке Сохранить.

Если сохранение требуется только для части веб-страницы, то требуемую информацию выделяют в браузере буксировкой мыши, как в текстовом редакторе, копируют в буфер обмена, а затем вставляют из буфера обмена в новый документ в текстовом редакторе «Блокнот» или Word. Сохранение получившегося документа делают обычным способом.

Именно так в Интернете можно собрать информацию для подготовки реферата практически на любую тему.

Чтобы сохранить ссылку на веб-страницу, достаточно ввести команду меню Избранное|Добавить в «Избранное», в диалоговом окне подобрать папку для сохранения и щёлкнуть по кнопке Добавить. Ссылка войдёт в меню кнопки Избранное.

Конспект урока по информатике «Поиск информации. Поисковые системы».

Реферат по информатике на тему: “Информационно-поисковая система”

СОВРЕМЕННЫЕ ИНФОРМАЦИОННО-ПОИСКОВЫЕ СИСТЕМЫ

  • Авторы
  • Руководители
  • Файлы работы
  • Наградные документы

Автор работы награжден дипломом победителя III степени

В ведение

В данной работе представлен материал по работе с информационно-поисковыми системами в сети Интернета. Тема достаточно актуальная и представляет повышенный интерес для учащихся.

Цель данной работы заключается в том, чтобы получить дополнительные знания по теме “Поисковые системы”, рассмотрев наиболее популярные системы в России и Зарубежье (русскоязычные и англоязычные).

Задачи состоят в том, чтобы подобрать соответствующий материал с последующей систематизацией, обобщением, иллюстрацией текста; провести сравнительную характеристику; научиться правильно оформлять запрос в поисковой строке системы.

Работа состоит из двух частей: теоретической (даны определения, типы, пречень наиболее известных систем) и практической (на примере поисковой системы Yandex разобраны основные правила составления наиболее точных запросов).

Основная часть

Глава 1. Что такое поисковая система Интернета

Поиско́вая систе́ма — программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в интернете.

Все поисковые системы объединяет то, что они расположены на специально-выделенных мощных серверах и привязаны к эффективным каналам связи. Поисковые системы называют еще информационно-поисковыми системами (ИПС).

Для поиска информации с помощью поисковой системы пользователь формулирует поисковый запрос. На основании запроса пользователя поисковая система генерирует страницу результатов поиска. Такая поисковая выдача может сочетать различные типы файлов, например: веб-страницы, изображения, видеофайлы. [12]

Глава 2. Типы поисковых систем

По методам поиска и обслуживания разделяют четыре типа поисковых систем: системы, использующие поисковых роботов; системы управляемые человеком; гибридные системы; мета-системы.

В архитектуру поисковой системы включены: поисковый робот сканирующий сайты сети Интернет, индексатор, обеспечивающий быстрый поиск, и поисковик – графический интерфейс для работы пользователя.

Цель поисковой системы заключается в том, чтобы находить документы, содержащие либо ключевые слова, либо слова как-либо связанные с ключевыми словами. Поисковая система тем лучше, чем больше документов релевантных запросу пользователя она будет возвращать. [12]

Глава 3. Популярные поисковые системы в России

§ 3.1. Yandex (русскоязычный интерфейс)

Ya ndexсамая популярная в настоящее время отечественная поисковая система. Начала работу в 1997 г. Она поддерживает собственный каталог Интернет – ресурсов. Также является лучшей поисковой системой для выявления иллюстраций. Англоязычный вариант снабжен справочником ресурсов Интернет. Обладает развернутой системой формирования запроса. В частности, допускается ввод поискового предписания на естественном языке – в этом случае все необходимые расширения производятся автоматически. Помимо веб-страниц в формате HTML, Яндекс индексирует документы в форматах PDF (Adobe Acrobat), Rich Text Format (RTF), двоичных форматах Word (.doc), Excel (.xls), PowerPoint (.ppt), RSS (блоги и форумы) (рис. 3.1). Текущий статус – активен. [12, 15]

Рис. 3.1. Поисковая система Яндекс ( https :// www . yandex . ru )

§ 3.2. Google (русскоязычный интерфейс)

Googleодна из самых полных и популярных зарубежных ИПС, крупнейшая в мире поисковая система интернета, принадлежащая корпорации Google Inc (рис. 3.2).

В России используется с русскоязычным интерфейсом. Отличительной особенностью ИПС Google является технология определения степени релевантности документа путем анализа ссылок других источников на данный ресурс. Чем больше ссылок на какую-либо страницу имеется на других страницах, тем выше ее рейтинг в ИПС Google. Google использует алгоритм расчёта авторитетности PageRank. PageRank является одним из вспомогательных факторов при ранжировании сайтов в результатах поиска. PageRank не единственный, но очень важный способ определения положения сайта в результатах поиска Google. Google использует показатель PageRank найденных по запросу страниц, чтобы определить порядок выдачи этих страниц посетителю в результатах поиска. В 2010 году компания запустила голосовой поиск в России. Чтобы осуществить поиск, необходимо нажать в телефоне кнопку рядом со строкой поиска и произнести свой запрос, телефон отправит ваш голос на сервер и браузер выдаёт строку с распознанным вашим запросом и результатами поиска по нему. Текущий статус – активен. [12, 15]

Рис. 3.2. Поисковая система Google ( https :// www . google . ru )

§ 3.3. Rambler (русскоязычный интерфейс)

Ramblerодна из первых российских ИПС, открыта в 1996 году. В конце 2002 года была произведена коренная модернизация, после которой Rambler вновь вошел в группу лидеров сетевого поиска. В настоящее время объем индекса составляет порядка 150 миллионов документов. Для составления сложных запросов рекомендуется использовать режим “Детальный запрос”, который предоставляет широкие возможности для составления поискового предписания с помощью пунктов меню (рис. 3.3). Текущий статус – работает.

По результатам тестов Rambler занимает 2-ое место после Yandex . Производительность поискового робота декларируется в объеме 6,9 млн. страниц в сутки. В системе также усовершенствован поиск по новостям: робот посылается на ведущие новостные сайты России каждые 2 часа. [12, 14, 15]

Рис. 3.3. Поисковая система Рамблер ( https :// www . rambler . ru )

§ 3.4. Mail (русскоязычный интерфейс)

Бесплатный почтовый сервис с неограниченным размером ящика, защитой от спама и вирусов. Социальная сеть, фото- и видеохостинги, поисковая система и другие коммуникационные и развлекательные сервисы (рис. 3.4).

Поиск@Mail.Ru — поисковая система от компании Mail.Ru. По данным на октябрь 2018 года на рынке Рунета он занимает долю около 2,9 % (третье место в рейтинге поисковых систем на российском рынке) [12].

Читайте также:
Математические основы информатики системы счисления, объекты

Системаначала работать в 2007 году. Объем индексного файла весной 2009 г. составлял более 1.5 миллиарда страниц, расположенных на русскоязычных серверах. Помимо разыскания текстов, системой осуществляется поиск иллюстраций и видеофрагментов, размещенных на специализированных “самонаполняемых” российских серверах: Фото@Mail.Ru, Flamber.Ru, 35Photo.ru, PhotoForum.ru, Видео@Mail.Ru, RuTube, Loadup, Rambler Vision и им подобных. Gogo.ru позволяет ограничивать область поиска сайтами коммерческой направленности, информационными сайтами, а также форумами и блогами. Форма “Расширенного поиска” также дает возможность ограничить разыскания определенными типами файлов (PDF, DOC, XLS, PPT), местом положения искомых слов в документе или определенным доменом. В ноябре 2013 в Google Play появилась новая версия поискового приложения от компании Mail.Ru, позволяющего переходить с главного экрана в любые социальные сети и содержащего быстрый доступ к поиску по картинам, видео и новостям. Текущий статус – активен. [11, 12, 15]

Рис. 3.4. Поисковая система Mail ( https :// mail . ru )

Глава 4. Популярные поисковые системы Зарубежья

У каждой страны существуют свои популярные поисковые системы. Рассмотрим наиболее востребованные.

§ 4.1. AltaVista и Yahoo ! (англоязычный интерфейс)

AltaVista was a Web search engine established in 1995. It became one of the most-used early search engines, but lost ground to Google and was purchased by Yahoo! in 2003, which retained the brand, but based all AltaVista searches on its own search engine. On July 8, 2013, the service was shut down by Yahoo! and since then, the domain has redirected to Yahoo!’s own search site. The word “ AltaVista ” is formed from the words for “high view” in Spanish ( alta + vista ).

AltaVista была веб-поисковой системой, созданной в 1995 году (рис. 4.1). Она стала одной из самых ранних поисковых систем, но потеряла почву для Google и была приобретена Yahoo! в 2003 году, который сохранил бренд, но основывал все поисковые запросы AltaVista на собственной поисковой системе. 8 июля 2013 года служба была закрыта Yahoo!. С тех пор домен перенаправляется на собственный поисковый сайт Yahoo! (рис. 4.2). Слово “AltaVista” формируется из слов “высокого вида” на испанском языке (alta + vista). Текущий статус AltaVista – не работает. Текущий статус Yahoo ! – активен. [2]

AltaVista – одна из старейших поисковых систем занимает одно из первых мест по объему документов – более 350 миллионов. AltaVista позволяет осуществлять простой и расширенный поиск. “Help” позволяет даже неподготовленным пользователям правильно составлять простые и сложные запросы. [12]

Рис . 4.1. Search system AltaVista (http://www.altavista.com)

Рис . 4.2. Search system Yahoo! (https://www.yahoo.com)

§ 4.2. Bing ( англоязычный интерфейс )

Bing is a search engine developed by the international corporation Microsoft . At the moment, the Bing system is considered the second highest search engine in the world.

Bing – это поисковая система, разработанная международной корпорацией Microsoft . В настоящий момент система Bing считается второй по величине поисковой системой в мире (рис. 4.3).

Обладает рядом уникальных особенностей – просмотр результатов выдачи на одной странице (нет необходимости перелистовать), динамическая настройка результатов выдачи (объема информации), которая отображается в результате поиска: лишь название, короткая информация, либо полная сводка.

На сегодняшний день поисковая система Bing используется в большинстве смартфонов и мобильных телефонов, выпускающихся на территории Канады и Америки. Текущий статус – активен. [16]

Рис . 4.3. Search system Bing (https://www. bing.com)

§ 4.3. Google ( англоязычный интерфейс )

This system was created as an educational project by students of Stanford University (USA) Larry Page and Sergey Brin. In 1996, they developed the Back Rub Substation System, and in 1998, based on it, created the Google system. [14]

Google is the first popular English-language search engine (79.65%), processes 41 billion 345 million queries per month (market share 62.4%), indexes more than 25 billion web pages, and can find information in 195 languages. Supports search in documents of formats PDF, RTF, PostScript, Microsoft Word, Microsoft Excel, Microsoft PowerPoint and others. [7]

Эта система была создана в качестве учебного проекта студентами Стэнфордского университета (США) Ларри Пэйджем и Сергеем Брином. В 1996 г. они разрабатывали ПС Back Rub, а в 1998 г. на ее основе создали систему Google (рис. 4.4).

Google – первая по популярности (79,65 %) поисковая англоязычная система, обрабатывает 41 млрд. 345 млн. запросов в месяц (доля рынка 62,4 %), индексирует более 25 млрд. веб-страниц, может находить информацию на 195 языках. Поддерживает поиск в документах форматов PDF, RTF, PostScript, Microsoft Word, Microsoft Excel, Microsoft PowerPoint и других. Текущий статус – активен.

Преимущества поискового алгоритма системы представлены в § 3.2.

Рис . 4.4. Search system Google (https://www. google.com)

Глава 5. Сравнительные характеристики популярных поисковиков

На данный момент самые популярные поисковики – это Google и Яндекс.

Две компании заняли прочные позиции в русскоязычном сегменте интернета. Отсюда и вытекает давний спор о том, “Гугл” или “Яндекс” что лучше. Ответить на этот вопрос довольно сложно, каждый имеет свои несомненные плюсы, а также недостатки. В большей степени использование каждого поисковика обусловлено привычкой. Сегодня Яндекс охватывает 58% пользователей, остальное делят между собой Гугл и остальные малоизвестные поисковые системы. Для того чтобы хоть как-то сравнить эти компании проведём обзор поисковых систем и часто используемых сопутствующих программ и сервисов:

Яндекс отличается более наполненным и разнообразным интерфейсом, тогда как Гугл склонен к минимализму;

С точки зрения веб-разработки, Гугл считается более стабильным, поэтому ему отдаётся больше предпочтений;

Яндекс – русская компания, Гугл – американская; Yandex имеет значительно больше полезных разработок, чем его оппонент;

Google предлагает пользователям отличные поисковые подсказки;

Считается что релевантность результатов поиска у Гугла выше, тем не менее, не стоит забывать, что Яндекс был разработан именно для русскоязычного сегмента интернета и в нём он превосходит конкурента. [1]

А также сравним скорость индексации и количество проиндексированных страниц (табл. 5.1). В данном случае приоритет на стороне Google . [12]

Таблица № 5.1. Сравнительные характеристики Yandex и Google

Информационно-поисковые системы

Автор работы: Пользователь скрыл имя, 12 Декабря 2012 в 02:05, реферат

Читайте также:
Электронные цифровые технологии особенности использования, модели
Описание работы

Управленческая деятельность в России, как и во всех развитых странах, осуществляется с помощью документов, которые одновременно являются источником, результатом и инструментом этой деятельности. В современном учреждении основными технологическими инструментами работы с документами являются компьютеры, установленные на рабочих местах исполнителей и объединённые в сеть. Если компьютерная сеть охватывает все рабочие места делопроизводственного персонала в структурных подразделениях организации, то появляется возможность использовать сеть для перемещения документов.

Содержание работы

1.Введение
2. Понятие информационно-поисковой системы (ИПС). 3
2.1. Состав компонент и технология работы с ИПС…………………………………………. 3
3. Классификация и характеристика методов поиска 10
4. Классификация систем DMS. 15
4.1. Характеристика систем, используемых для организации архивов……………………. 15
5. Заключение 18
6. Литература 19

Файлы: 1 файл

Реферат ДУД.doc

Кафедра менеджмента в сфере услуг

по дисциплине «Документирование управленческой деятельности» на тему:

Студент 3ого курса группы ФУ-33в

Зам. зав. кафедрой по научной

работе, доцент, к.т.н.
Некрасов Михаил Иванович

Введение

Управленческая деятельность в России, как и во всех развитых странах, осуществляется с помощью документов, которые одновременно являются источником, результатом и инструментом этой деятельности. В современном учреждении основными технологическими инструментами работы с документами являются компьютеры, установленные на рабочих местах исполнителей и объединённые в сеть. Если компьютерная сеть охватывает все рабочие места делопроизводственного персонала в структурных подразделениях организации, то появляется возможность использовать сеть для перемещения документов. Россия пока не перешла полностью на электронный документооборот и каждая организация располагает обязательным наличием бумажного подлинника любого документа даже при существовании электронного варианта. Для удобства и экономии времени поиска нужных документов созданы специальные поисковые системы. Они существуют отдельно для бумажных носителей – архивы. И для электронных – компьютерные программы DMS. Целью работы является знакомство с понятием информационно-поисковой системы (ИПС), составом компонент и технологией работы с ИПС, классификацией и характеристикой методов поиска, а также классификацией систем DMS.

2. Понятие информационно-поисковой системы (ИПС).

2.1. Состав компонент и технология работы с ИПС

В работе современных предприятий важную роль играют его информационные ресурсы, под которыми можно понимать проектную документацию, переписку с партнерами, внутренние приказы и распоряжения, финансовые данные и другие документы, которые служат основой для принятия новых решений и используются в процессах управления предприятием. И если для хранения структурированных данных можно применять специализированные информационные системы (типа бухгалтерской или торговой системы или системы планового отдела), основанные, на использовании СУБД (Системы управления базами данных), то для неструктурированных данных нужны системы общего назначения – электронные архивы, работающие на принципах информационно-поисковой системы.

Информационно-поисковая система (ИПС) – это система, предназначенная для хранения и поиска документов с текстовой, графической, табличной информацией по атрибутам, ключевым словам документа и содержанию в какой-либо предметной области. Выделяют ИПС двух типов: фактографические и документографические системы. ИПС фактографического типа предназначены для хранения и поиска фактов, показателей, характеристик каких-либо объектов или процессов (например, сведения о работниках, о предприятиях, акционерах и т.д.). Документографические ИПС отличаются тем, что объектом хранения и поиска в этих системах служат документы, отчеты, рефераты, обзоры, журналы, книги и т.д. Сценарий поиска документа при помощи ИПС обычно сводится к вводу запроса на поиск, состоящего из одного или нескольких слов, после чего предъявляется список имен найденных документов. Пользователь может открыть любой из найденных документов и если поисковая система позволяет, вхождения искомых слов в документе выделяются – «подсвечиваются».

Можно выделить следующие особенности организации и функционирования документографической ИПС, отличающие ее от систем управления базами структурированных данных:

– Документы могут храниться на бумаге, микрографических носителях или существовать в электронных форматах. Микрографические форматы включают микрофильмы, микрофиши, слайды и другие микроформы, производимые разнообразными документными камерами. Электронные форматы еще многочисленнее, они включают документы, подготовленные в текстовых процессорах, системах электронной почты и других компьютерных программах, оцифрованные изображения прошедших сканирование документов и проч. При этом предполагается обязательное хранение как электронных копий документов, так и их бумажных оригиналов.

– Если документы занимают большой объем и полные электронные копии выдавать на просмотр или хранить невозможно, то для таких документов создают и хранят электронные адреса их хранения.

– Поиск осуществляется нахождением документа по двум принципам: по атрибутам документа – дате создания, размеру, автору и пр. и по его содержанию (тексту). Обычно поиск по содержанию документа выполняется двумя способами: по ключевым словам и по всему тексту, который называют полнотекстовым, подче ркивая тем самым, что для поиска используется весь текст документа, а не только его реквизиты.

– Для поиска документов создают и хранят их поисковые образы.

Поисковый образ документа (ПОД) – это совокупность кодов ведущих ключевых слов (дескрипторов), которые описывают смысл, содержание документа.

– Ключевые слова и их коды хранятся в специальном словаре – тезаурусе.

– Для того, чтобы осуществлять поиск документов, нужно создать информационно- поисковый язык (ИПЯ), в состав которого входит тезаурус и грамматика языка, т.е. совокупность правил задания множества высказываний на множестве ключевых слов.

– Чтобы отыскать документ, нужно создать с помощью ИПЯ поисковый образ запроса (ПОЗ), который представляет собой совокупность закодированных ключевых слов, описывающие те документы, которые нужно найти.

Схема взаимодействия компонентов ИПС представлена на рис.1.

Рис. 1. Схема взаимодействия компонентов ИПС

ИПС состоит из следующих обеспечивающих подсистем:

– лингвистическое обеспечение, включающее в свой состав информационно-поисковый язык;

– техническое обеспечение системы, включающее ЭВМ и устройства создания, хранения, чтения и размножения копий на бумажных носителях, в микроформатах и в электронной форме;

– информационное обеспечение, состоящее из БД (Баз данных) документов (БД Док.), адресов (БД Адр.) и БД поисковых образов документов (БД ПОД) и списков дескрипторов и их кодов – тезауруса;

Программное обеспечение ИПС предназначено для автоматизации следующих основных функций, которые должна выполнять эта система:

– составления, кодирования и загрузки базы данных ПОД;

– загрузки БД документов и их адресов хранения;

– составления, кодирования ПОЗ;

– выполнение операции поиска и выдачи ответ а на запрос в виде документа или адресов хранения документов на экран ЭВМ, на бумагу, в файл;

– актуализация баз данных ПОД, документов и адресов;

Рассмотрим основные понятия, употребляемые в сфере поиска документов.

Релевантность – степень соответствия найденного документа запросу. Найденный по запросу документ может иметь отношение к запросу, т. е. содержать нужную (искомую) информацию, а может и не иметь никакого отношения. В первом случае документ называется релевантным (по- английски relevant – «относящийся к делу»), во втором – нерелевантным, или шумовым. Как правило, в любой поисковой системе по запросу выдается несколько (чаще много) найденных документов. Многие из них могут повествовать не о том. И наоборот, некоторые важные, релевантные, документы могут быть пропущены при поиске. Ясно, что количество тех и других определяет качество поиска, которое можно определить достаточно точно. Основными понятиями в мире поисковых средств являются идеи точности и полноты поиска.

Читайте также:
Системное программное обеспечение компьютера - классификация и виды

Точность поиска (Т) определяется тем, какая часть информации, выданная в ответ на запрос, является релевантной, т.е. относящейся к этому запросу и является параметром, показывающим, какова доля релевантных документов в общем числе найденных. Этот показатель рассчитывается по формуле:

Если, например, все выданные по запросу документы относятся к делу, то точность равна 100%; если, напротив, все документы шумовые, то точность поиска равна нулю.

Полнота поиска (П) – дополнительный параметр, показывающий, какова доля (или процент) найденных релевантных документов в общем количестве релевантных документов, т.е. характеризуется соотношением между всей релевантной информацией, имеющейся в базе, и той ее частью, которая включена в ответ и рассчитывается по формуле:

Если в области поиска на самом деле имеется 100 документов, содержащих нужную информацию, а по запросу найдено из них всего 30, то полнота поиска равна 30%. Кроме этого при оценке поисковых систем учитывается, с какими типами данных может работать та или иная система, в какой форме представляются результаты поиска и какой уровень подготовки пользователей необходим для работы в этой системе.

Следует отметить, что точность поиска и его полнота зависят не только от свойств поисковой системы, но и от правильности построения конкретного запроса, а также от субъективного представления пользователя о том, какая нужна ему информация. Если стоит проблема оценки нескольких систем и выбора наиболее эффективной, можно вычислить средние значения полноты и точности рассматриваемых конкретных систем, протестировав их на эталонной базе документов.

Индексация документов (т.е. составление ПОД), которая означает предварительную подготовку текстов для поиска и применяется главным образом для ускорения поиска; как правило, текстовые базы данных, предназначенные для многократного поиска, обрабатывают заранее, составляя так называемый индекс (ПОД). При индексации поисковая система составляет списки слов, встречающихся в тексте, и приписывает каждому слову его код – координаты в тексте (чаще всего номер документа и номер слова в документе).

При поиске слово ищется в индексе, и по найденным координатам выдаются нужные документы. Если слов в запросе несколько, над их координатами производится операция пересечения. В том случае, если множество документов пополняется, приходится пополнять и индекс.

Единица поиска – это квант текста, в пределах которого в данной поисковой системе осуществляется поиск, от величины которого зависит показатель точности поиска, величина шума и время ответа на запрос.

Единицей поиска может быть документ, предложение или абзац.

В технологии использования ИПС можно выделить три группы операций:

– операции, связанные с получением поисковых образов документов (ПОД), описывающих содержание документов и загрузкой их в базу данных (БД ПОД), а также загрузкой самих документов или их адресов хранения в БДДок. и БДАдр.;

– операции составления поисковых образов запроса (ПОЗ) с использованием тезауруса, поиска и выдачи результатов на просмотр и отбор или файл или на печать найденных документов или списка адресов;

– операции ведения информационно-поисковой системы, включающие актуализацию БД ПОД, БДДок., БДАдр. и тезауруса вследствие возникновения и необходимости пополнения памяти системы новыми документами или ключевыми словами.

В состав операций ведения ИПС входит также процедура выдачи справок о работе системы, о ее структуре, методах поиска, классах и видах хранимых документов.

3. Классификация и характеристика методов поиска

Одной из проблем организации СУД является выбор метода поиска и разработка или выбор программного обеспечения, что в значительной степени зависит от применяемых методов индексирования. Как было сказано выше, индексирование загружаемой на хранение информации может осуществляться по ключевым словам, по атрибутам документа либо путем создания полнотекстового индекса. Суть последнего подхода заключается в том, что при создании индексного файла (индексированной матрицы) в него вносятся все значимые слова (без союзов, предлогов и т. п.) из всех документов в алфавитном порядке, которые затем объединяются в пары с указателями на документы, содержащие эти слова.

Задача поиска нужного документа формулируется так: зная примерные характеристики документа, нужно найти его, где бы он ни хранился.

Характеристики документа могут быть как внешние (атрибуты документа): название, время создания, автор, размер документа, местонахождение и др., так и внутренние (содержание документа): заголовок, текст документа. Как правило, осуществляют поиск документов по совокупности внешних и внутренних характеристик, но если документов много, и если необходимо осуществлять поиск документов, согласно ситуации, то нужный документ отыскивают по его содержанию (тексту), а не по реквизитам (атрибутам).

Существует несколько методов поиска документов по содержанию.

Традиционные подходы к организации поиска информации можно разделить на три группы: методы индексного (или двоичного) поиска, статистические методы и семантические методы, основанные на базах знаний. Рассмотрим некоторые из них.

Индексный, или двоичный, поиск применятся главным образом со структурированными базами данных. В таких методах слова интерпретируются как последовательности закодированных символов.

Информационно-поисковые системы

ИПС (информационно-поисковая система) – это система, обеспечивающая поиск и отбор необходимых данных в специальной базе с описаниями источников информации (индексе) на основе информационно-поискового языка и соответствующих правил поиска. Главной задачей любой ИПС является поиск информации релевантной информационным потребностям пользователя. Очень важно в результате проведенного поиска ничего не потерять, то есть найти все документы, относящиеся к запросу, и не найти ничего лишнего. Поэтому вводится качественная характеристика процедуры поиска – релевантность. Релевантность – это соответствие результатов поиска сформулированному запросу. Далее мы будем, в основном, рассматривать ИПС для всемирной паутины (WWW). Основными показателями ИПС для WWW являются пространственный масштаб и специализация. По пространственному масштабу ИПС можно разделить на локальные, глобальные, региональные и специализированные. Локальные поисковые системы могут быть разработаны для быстрого поиска страниц в масштабе отдельного сервера. Региональные ИПС описывают информационные ресурсы определенного региона, например, русскоязычные страницы в Интернете. Глобальные поисковые системы в отличие от локальных стремятся объять необъятное – по возможности наиболее полно описать ресурсы всего информационного пространства сети Интернет. В общем случае, можно выделить следующие поисковые инструменты для WWW: каталоги, поисковые системы, метапоисковые системы.ИПС
Читайте также:
Интернет 📡 определение, история возникновения глобальной сети

Содержание

  • 1 Виды поисковых инструментов
  • 2 История
  • 3 Типы ИПС
  • 4 Части ИПС
  • 5 Задачи ИПС

Виды поисковых инструментов

В общем случае, можно выделить следующие поисковые инструменты для WWW: каталоги, поисковые системы.

Каталог – поисковая система с классифицированным по темам списком аннотаций со ссылками на web-ресурсы. Классификация, как правило, проводится людьми. Поиск в каталоге очень удобен и проводится посредством последовательного уточнения тем. Тем не менее, каталоги поддерживают возможность быстрого поиска определенной категории или страницы по ключевым словам с помощью локальной поисковой машины. База данных ссылок (индекс) каталога обычно имеет ограниченный объем, заполняется вручную персоналом каталога. Некоторые каталоги используют автоматическое обновление индекса. Результат поиска в каталоге представляется в виде списка, состоящего из краткого описания (аннотации) документов с гипертекстовой ссылкой на первоисточник.

Поисковая машина – поисковая система с формируемой роботом базой данных, содержащей информацию об информационных ресурсах. Отличительной чертой поисковых машин является тот факт, что база данных, содержащая информацию об Web-страницах, статьях Usenet и т.д., формируется программой-роботом. Поиск в такой системе проводится по запросу, составляемому пользователем, состоящему из набора ключевых слов или фразы, заключенной в кавычки. Индекс формируется и поддерживается в актуальном состоянии роботами-индексировщиками. В описании документа чаще всего содержится несколько первых предложений или выдержки из текста документа с выделением ключевых слов. Как правило, указана дата обновления (проверки) документа, его размер в килобайтах, некоторые системы определяют язык документа и его кодировку (для русскоязычных документов). Что можно делать с полученными результатами? Если название и описание документа соответствует вашим требованиям, можно немедленно перейти к его первоисточнику по ссылке. Это удобнее делать в новом окне, чтобы иметь возможность далее анализировать результаты выдачи. Многие поисковые системы позволяют проводить поиск в найденных документах, причем вы можете уточнить ваш запрос введением дополнительных терминов. Если интеллектуальность системы высока, вам могут предложить услугу поиска похожих документов. Для этого вы выбираете особо понравившийся документ и указываете его системе в качестве образца для подражания. Однако, автоматизация определение похожести – весьма нетривиальная задача, и зачастую эта функция работает неадекватно вашим надеждам. Некоторые поисковики позволяют провести пересортировку результатов. Для экономии вашего времени можно сохранить результаты поиска в виде файла на локальном диске для последующего изучения в автономном режиме.Виды поисковых инструментов

История

Первые поисковые системы появились в середине 90-х годов XX века и были похожи на обычный предметный указатель в книге: в базе поисковой системы хранились ключевые слова со страниц сотен сайтов, и поиск осуществлялся исключительно по ним. Позднее был разработан полнотекстовый поиск. Каждое слово и фраза фиксировались в индексе поисковой системы для каждой страницы сайта в отдельности. Это дало возможность поиска по любым словам и их сочетаниям.

Информационно-поисковые системы совершенствуются постоянно. Это обусловлено стремлением учесть особенности человеческого поведения, чтобы сделать выдачу для каждого посетителя уникальной. Теперь в механизмы обработки и поиска информации все чаще включаются технологии искусственного интеллекта, построенные на новейших вычислительных методах.История

Типы ИПС

ИПС бывают двух типов:

1. Документографические. В документографических ИПС все хранимые документы индексируются специальным образом, т. е. каждому документу присваивается индивидуальный код, составляющий поисковый образ. Поиск идет не по самим документам, а по их поисковым образам. Именно так ищут книги в больших библиотеках. Сначала отыскивают карточку в каталоге, а затем по номеру, указанному на ней, отыскивается и сама книга.

2. Фактографические. В фактографичеких ИПС хранятся не документы, а факты, относящиеся к какой-либо предметной области. Поиск осуществляется по образцу факта.Типы ИПС

Части ИПС

Каждая ИПС состоит из двух частей: базы данных (БД) и системы управления базами данных (СУБД).

База данных – это поименованная совокупность структурированных данных, относящихся к определенной предметной области.

Система управления базами данных – это комплекс программных и языковых средств, необходимых для создания баз данных, поддержания их в актуальном состоянии и организации поиска в них необходимой информации.Части ИПС

Задачи ИПС

С точки зрения требований, предъявляемых к точности поисковых операций, общую задачу поиска можно разделить на две крупные подзадачи:

а) поиск в глобальных базах текстовой информации (Интернет).

б) поиск в локальных (корпоративных, сайтовых или персональных) базах.

В глобальных базах (вследствие их всеобъемлющего характера) с очень большой вероятностью может быть найден какой-нибудь подходящий ответ практически на большинство запросов пользователей даже без привлечения для этих целей серьезного методического аппарата. Поэтому модели поисковых систем для Интернет, как правило, базируются, на вероятностно-статистических алгоритмах, ориентированных на отбор текстовой информации по относительно простым формальным правилам и признакам (обычно по сигнатурам ключевых слов или их сочетаний). В них слабо учитываются (или не учитываются вообще) лингвистические особенности и грамматический строй языковой основы отбираемой текстовой информации. Для более качественного отбора текстовых ресурсов, соответствующих запросу пользователя, в глобальных поисковых системах используются также некоторые искусственные приемы априорного назначения релевантности ресурсу (в виде индексов цитирования, частоты встречаемости ключевых слов на данном ресурсе и т.п.). Обращение к лингвистическим методам в глобальных поисковых системах сводится в лучшем случае только к использованию морфологических характеристик лексических единиц того или иного языка. Поэтому, несмотря на широкую популярность подобных систем, при реализации информационно-поисковых процедур на больших объемах информации наряду с полезной передается много лишней, “шумовой” информации. Задача собственно выбора подходящих сведений среди отобранной по запросу информации возлагается на пользователя.

Локальные базы (корпораций, ведомств, учреждений) характеризуются существенно меньшими объемами информации (по сравнению с глобальными Интернет-базами). Очевидно, что для поиска точного ответа в локальных базах (вследствие их малой размерности) вероятностно-статистические методы, широко применяемые в глобальных поисковых системах, принципиально не подходят. Качество работы организационных систем (госорганов, ведомств, корпораций и т.д.) нередко напрямую зависит от оперативности обеспечения персонала необходимой информацией (распорядительной, учетной, текущей, справочной и т.д.) по различным предметным областям и темам. Успешный поиск точного ответа в локальных системах может быть реализован только на основе достаточного глубокого лексико-грамматического анализа текстовой базы и запросов пользователей, а также широкого привлечения эвристических методов оценки их смыслового соответствия.Задачи ИПС

Тема: Информационно-поисковые системы Интернет

ПЕРМСКИЙ ИНСТИТУТ ЭКОНОМИКИ И ФИНАНСОВ

Тема: Информационно-поисковые системы Интернет

контактная информация (e-mail):

Читайте также:
Как начать программировать - советы новичкам

1 Понятие информационных поисковых систем. 4

2 Информационно-поисковые системы Интернета. 5

3 Основные виды поиска. 9

Список литературы.. 12

Приложение 1. 13

Введение

Современный этап развития цивилизации характеризуется переходом наиболее развитой части человечества от индустриального общества к информационному. Одним из наиболее ярких явлений этого процесса является возникновение и развитие глобальной информационной компьютерной сети. С появлением Интернета проблема поиска становилась более актуальной. Интернет – это единая информационная среда, также это большое количество полезной информации, для поиска которой необходимо затратить много времени.

Из-за быстрого роста информации, доступной в Сети, навигационные методы просмотра быстро достигают предела их функциональных возможностей, не говоря уже о пределе их эффективности. Не указывая конкретных цифр, можно сказать, что нужную информацию уже не представляется возможным получить сразу, так как в Сети сейчас находятся миллиарды документов и все они в распоряжении пользователей Интернет, к тому же сегодня их количество возрастает. Количество изменений, которым эта информация подвергнута, огромно и, самое главное, они произошли за очень короткий период времени. Основная проблема заключается в том, что единой полной функциональной системы обновления и занесения подобного объема информации, одновременно доступного всем пользователям Интернет во всем мире, никогда не было. Для того, чтобы структурировать информацию, накопленную в сети Интернет, и обеспечить ее пользователей удобными средствами поиска необходимых им данных, были созданы поисковые системы.

1 Понятие информационных поисковых систем

Информационно-поисковая система — программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в Интернете.

Информационно-поисковая система выполняет следующие функции:

· хранения больших объемов информации;

· быстрого поиска требуемой информации;

· добавления, удаления и изменения хранимой информации;

· вывода информации в удобном для человека виде.

Создание и использование информационно-поисковой системы началось в конце 1950-х – начале 1960-х годов. Информационно-поисковая система опирается на базу данных, в которой осуществляет поиск нужных документов по запросам пользователей[1]. Частным случаем информационно-поисковой системы является информационно-справочная система, которая в ответ на запросы выдает сведения, в явной форме отсутствующие в базе данных. Широко информационно-поисковые системы используются и в базах знаний.

2 Информационно-поисковые системы Интернета

Все поисковые системы объединяет то, что они расположены на специально-выделенных мощных серверах и привязаны к эффективным каналам связи. Поисковые системы называют еще информационно-поисковыми системами (ИПС). Количество одновременно обслуживаемых посетителей наиболее популярных систем достигает многих тысяч. Самые известные обслуживают в сутки миллионы клиентов. В случаях, когда поисковая система имеет в своей основе каталог, она называется каталогом. В ее основе лежит работа модераторов. В основе же ИПС с полнотекстовым поиском лежит автоматический сбор информации. Он осуществляется специальными программами. Эти программы периодически исследуют содержимое всех ресурсов Интернета. Для этого они перемещаются, или как говорят, ползают, по разным ресурсам. Соответственно такие программы называются роботы. Есть и другие названия: поскольку WWW – это аббревиатура выражения Всемирная паутина, то такую программу естественно назвать спайдером по англ. – паук. В последнее время используются другие названия: автоматические индексы или директории. Все эти программы исследуют и «скачивают» информацию с разных URL-адресов. Программы указанного типа посещают каждый ресурс через определенное время. Ни одна поисковая система не в состоянии проиндексировать весь Интернет. Поэтому БД, в которых собраны адреса проиндексированных ресурсов, у разных поисковых систем разные. Тем не менее, многие из них стремятся, по возможности, охватывать в своей работе все пространство мировой Сети. Это универсальные системы[2].

Итак, работа поисковой системы обеспечивается тремя составляющими:

· программа «робот» (спайдер). Она анализирует ресурсы и производит их индексацию.

· индексы поисковой системы. Они формируют создаваемые поисковой системой собственные БД.

· программа, которая в соответствии с запросом пользователя готовит ему ответ на основе анализа индексов, то есть собственных БД.

Пользователь реально имеет дело только с последней из этих трех составляющих.

Мощные поисковые системы универсального типа созданы для работы на всех основных языках мира. Каждая страна старается создать хотя бы одну собственную поисковую систему. Познакомимся с основными отечественными и зарубежными поисковыми системами.

Яndex (http://www. yandex. ru) – самая популярная в настоящее время отечественная поисковая система. Начала работу в 1997 г. Она содержит более 33 миллионов документов, поддерживает собственный каталог Интернет-ресурсов. Также является лучшей поисковой системой для выявления иллюстраций. Англоязычный вариант снабжен справочником ресурсов Интернет. Обладает развернутой системой формирования запроса. В частности, допускается ввод поискового предписания на естественном языке – в этом случае все необходимые расширения производятся автоматически. Более детальный запрос может быть составлен с помощью режима «Расширенный поиск» (знак +), в котором применяется система многоступенчатых меню.

Яндекс – единственная российская поисковая система, индексирующая документы в форматах PDF, DOC, RTF, SWF, PPT и XLS. Актуализация базы осуществляется еженедельно.

Rambler (http://www. rambler. ru) – одна из первых российских ИПС, открыта в 1996 году. В конце 2002 года была произведена коренная модернизация, после которой Rambler вновь вошел в группу лидеров сетевого поиска. В настоящее время объем индекса составляет порядка 150 миллионов документов. Для составления сложных запросов рекомендуется использовать режим «Детальный запрос», который предоставляет широкие возможности для составления поискового предписания с помощью пунктов меню.

АПОРТ (http://www. aport. ru). На сегодняшний день объем ее базы составляет более 20 миллионов документов. Система обладает широким спектром поисковых возможностей. АПОРТ обладает функцией встроенного переводчика, это дает пользователю возможность формулировать запросы, как на русском, так и на английском языках. Кроме того, АПОРТ имеет специальные режимы для поиска иллюстраций и аудио файлов.

Поисковая система компании Mail. ru начала работать в 2007 году. Объем индексного файла весной 2009 г. составлял более 1.5 миллиарда страниц, расположенных на русскоязычных серверах. Помимо разыскания текстов, системой осуществляется поиск иллюстраций и видеофрагментов, размещенных на специализированных “самонаполняемых” российских серверах: Фото@Mail. Ru, Flamber. Ru, 35Photo. ru, PhotoForum. ru, Видео@Mail. Ru, RuTube, Loadup, Rambler Vision и им подобных. Gogo. ru позволяет ограничивать область поиска сайтами коммерческой направленности, информационными сайтами, а также форумами и блогами. Форма “Расширенного поиска” также дает возможность ограничить разыскания определенными типами файлов (PDF, DOC, XLS, PPT), местом положения искомых слов в документе или определенным доменом.

Наиболее популярными зарубежными поисковыми системами являются Google, Alta Vista, Scirus.

Google (http://www. ) — одна из самых полных зарубежных ИПС. Объем ее базы составляет более 560 миллионов документов. Отличительной особенностью ИПС Google является технология определения степени релевантности документа путем анализа ссылок других источников на данный ресурс. Чем больше ссылок на какую-либо страницу имеется на других страницах, тем выше ее рейтинг в ИПС Google.

Читайте также:
Информационная модель - суть, характеристики, разновидности

AltaVista (http://www. ) – одна из старейших поисковых систем занимает одно из первых мест по объему документов – более 350 миллионов. AltaVista позволяет осуществлять простой и расширенный поиск. «Help» позволяет даже неподготовленным пользователям правильно составлять простые и сложные запросы.

По данным компании Net Applications, в ноябре 2011 года использование поисковых систем распределялось следующим образом:

3 Основные виды поиска

Поиск информации является одной из составляющих человеческой деятельности. В Интернете ежедневно появляется и исчезает огромное количество ресурсов. Необходимо уметь в них ориентироваться. Чтобы эффективно выполнить поиск, нужно умело составить запрос к поисковой системе. Если ответ ищется в каталоге, то особых сложностей при работе здесь нет. Создатели каталога и модераторы озаботились созданием разделов каталога. Пользователь должен только четко определиться с предметом поиска и затем воспользоваться структурой, которая ему предложена.

В основе полнотекстового поиска лежит умение удачно составить поисковый запрос. При прочих равных условиях следует выбирать для поиска наиболее суженное, мало распространенное слово. В то же время может случиться и так, что поиск по слишком узкому термину не дает результатов. Тогда надо переходить к более широким терминам.

Если поиск по узкому термину не дает результатов, то следует постепенно расширять поисковое понятие или же переходить к смежным терминам.

Поиск по возможности лучше вести по нескольким словам, их сочетаниям, а иногда и по конкретным фразам.

При проведении поиска и оценке его результатов необходимо помнить:

Необходимо остерегаться анонимных сведений, т. к. их источник установить очень трудно.

· В сомнительных случаях необходимо проверить найденные сведения запросом в Сети отзывов и мнений по поводу найденных сведений.

· Неожиданно появляющиеся и затем быстро исчезающие ресурсы не надежны.

· В сомнительных случаях необходимо обращаться к таким проверенным источникам, как сетевые энциклопедии, справочники и специальные учебные сайты.

Приступая к поиску, вы вводите одно или несколько ключевых слов, выбираете вид поиска и нажимаете на клавишу Enter. В ответ выдается список адресов (URL) – список всех индексированных страниц, содержащих любые ключевые слова. Нередко число совпадений при таком поиске огромно. Однако если поисковая система хорошо сортирует результаты по тематике, то нужную страницу можно найти в верхней части списка. Поиск по любому слову может быть удобен в случаях, когда пользователь не уверен в ключевых словах.

Следует иметь в виду, что поисковые машины относятся к словам по-разному. Такие ИПС как «Яндекс» понимают слово во всех его грамматических формах и с учетом этого будут его искать. Им известна морфология русского языка, т. е. если в запросе написать и «человек» и «люди», то ответ будет одним и тем же.

При поиске в Интернете используются следующие логические операторы:

· AND – и (и то и то – два термина вместе);

· OR – или (или тот термин или тот);

· NOT – не (не нужен такой-то термин).

Используя значок *, можно расширить запрос до всех слов, содержащих введенную часть. Например, если ввести электротехни* то в результатах поиска окажутся страницы, содержащие электротехника, электротехнический и т. п. Знак усечения * может быть подставлен в ключ справа, слева и внутри. В Yandex можно запрашивать конкретную форму слова при поиске (исключив другие словоформы), поставив перед ним знак «!»[3].

Заключение

Считается, что идеальная поисковая машина должна отвечать следующим требованиям:

1. простота в использовании;

2. чётко организованный и обновляемый индекс;

3. быстрый поиск в базе данных и быстрое реагирование;

4. надёжность и точность результатов поиска.

Масштабы информационных ресурсов и их количество постоянно расширяется. Однако в этом информационном объеме бывает не очень легко найти необходимый документ.

Поисковые системы Интернета, пожалуй один из способов двигаться вперед по направлению развития и совершенствования. Развиваясь сами, поисковые системы развивают все остальное вокруг себя, выгодно принуждая совершенствовать качество самого Интернета, а так же технологий связанных с этим. Как и во всех других отраслях, в Интернете существуют свои лидеры, которые прошли испытание временем и добились каких либо значимых результатов, что в свою очередь позволило занять определенные ниши и позиции в мировой паутине. Поисковые системы Интернета словно огромные столпы на которых держится весь процесс движения. Конечно, много может быть несовершенно как в поиске так и в технологиях, и в наши дни несмотря на то что уже достаточная доля Интернет трафика имеет свои предпочтения все же в Интернете появляются новые поисковые системы, которые к сожалению так и остаются неизвестными.

В данный период времени происходит постоянное совершенствование и развитие как самих поисковых систем так и всех остальных участников Интернета.

Список литературы

1. Петров, системы// – СПб.: Питер – 2003.

2. Косарев, В. П., Еремин, информатика//, – Москва : Финансы и статистика – 2002.

3. Семакин, И. Г., Хеннер, системы и модели//, – Москва : БИНОМ – 2005.

Приложение 1

[1] Петров, системы// – СПб. : Питер – 2003.

[2] Семакин, И. Г., Хеннер, системы и модели//, – Москва : БИНОМ – 2005.

[3] Косарев, В. П., Еремин, информатика//, – Москва : Финансы и статистика – 2002.

Первое знакомство с информационно поисковыми системами. История создания и развитие современных ПС

Добрый день, мои уважаемые читатели. Сегодня мы коснемся чрезвычайно интересной и важной темы – информационно поисковые системы. Умение правильно работать с ними, знание основных понятий и принципов работы смогут помочь начинающим пользователям научиться быстро и оперативно искать различную информацию в сети, получать нужные данные и быстро развивать свой интернет бизнес.

В данной статье я расскажу об истории создания систем поиска, принципах их работе и структуре. Помимо этого, остановлюсь на очень важных фишках, которые необходимо обязательно знать при работе с ИПС.

Итак, давайте более подробно изучим, что такое ИПС, какие компоненты входят в их состав.

Информационно – поисковые системы (ИПС) и их виды

Данное понятие возникло еще в конце 80 – х, начале 90 – х годов прошлого века. Именно тогда и возникли их первые прототипы, как в России, так и за рубежом. Согласно определению – это система, которая позволяет искать, обрабатывать, отбирать требуемые данные запроса в своей особой базе, где находятся описания различных источников информации, а также правила пользования ими.

Читайте также:
История развития вычислительной техники - таблица поколений ЭВМ

Основной ее задачей является поиск нужной пользователю информации. Для того, чтобы он был более эффективным, используется понятие релевантности, то есть то, насколько сами результаты поиска точно подходят тому или иному запросу.

К основным типам ИПС относятся следующие понятия:

  • Каталог, который представляет собой специально созданную структуру. Он имеет свою четкую классификацию по различным темам. Каталоги также включают особые аннотации с многочисленными ссылками на различные ресурсы в сети интернет. Это могут быть сайты, порталы, веб-страницы и т д. Разработка каталогов той или иной ИПС явилось очень удобной благодаря тому, что они могут поддерживать оперативный поиск той или иной категории различных ресурсов по особым ключевикам (словам) с использованием специальных роботов – пауков.

Индексация каталога может производиться, как вручную, так и автоматически с обновлением индекса. В свою очередь сам результат работы системы включает в себя особый список. В него входят гиперссылка на требуемые ресурсы и описание того или иного документа в интернете.

Из наиболее популярных каталогов можно выделить: Yahoo, Magellan (зарубежные) и Weblist, Улитка и @Rus из отечественных.

  • Поисковая машина представляет собой особую структуру поиска, которая для формирования базы данных применяет специальных роботов. Она содержит различные данные об интернет – ресурсах. Самым главным ее преимуществом является то, что ее основные функции автоматизированы, а ее база создается поисковым роботом. Для того чтобы произвести поиск в данной системе, пользователь вводит запрос, который включает в себя набор доступных ключевиков, либо фразу в «кавычках». В свою очередь индекс создают роботы – индексировщики. Само описание документа содержит: начальные предложения статьи, кусочек текста, где выделены «ключевики». В документе также есть дата, когда обновляли документ, его размер в Кб или Мб, а также кодировка.

К наиболее распространенным зарубежным ИПС относят – Google, Altavista, Excite. Русские – «Яндекс» и «Рамблер».

  • В мире существует огромное количество различных видов ИПС, которые содержат множество источников информации. Разумеется, что даже наличие самого современного и мощного сервера не может удовлетворить запросы миллионов пользователей. Именно поэтому, появились специальные метапоисковые системы. Они могут одновременно пересылать запросы пользователей различным поисковым серверам, а на основе своего обобщения имеют возможность предоставить пользователю документ, содержащий ссылки на требуемый ресурс. К их числу можно отнести – MetaCrawler или SavvySearch.

История создания ИПС

Самые первые ИПС появились в середине 90 – х годов 20 века. Они весьма напоминали обычные указатели, которые находятся в любых книгах, некие справочники. В их базе данных содержались специальные ключевики (слова), которые различными способами собирались с многочисленных сайтов. Так, как интернет – технологии были не совершенными, то и сам поиск выполнялся только по ключевым словам.

Значительно позднее был разработан специальный полнотекстовый поиск, облегчающий нахождение необходимой пользователю информации. Система производила фиксацию ключевых слов. Благодаря ей, пользователи могли производить нужные запросы по тем или иным словам и различным словосочетаниям.

Одной из первых, была «Wandex». Ее разработкой занимался очень известный программист Мэтью Греэм в 1993 году. Также, в этом же году возникла и новая «поисковка» «Aliweb» (кстати, и по сей день успешно работает). Однако все они имели достаточно сложную структуру и не обладали современными технологиями.

Одной из наиболее удачных явилась «WebCrawler», которая впервые была запущена в 1994 году. Отличительной особенностью и главным преимуществом, выгодно выделяющим ее среди других систем поиска, явилось то, что она могла находить любые ключевики на той или иной странице. После этого, это стало своего рода эталоном и для всех остальным ИПС, которые разрабатывались позднее.

Значительно позже возникли и другие поисковики, которые иногда конкурировали между собой. Это были – «Excite», «AltaVista», «InfoSeek», «Inktomi» и многие другие. Начиная с 96 года, российские пользователи сети начали работать с «Рамблером» и «Апортом». Но, настоящим триумфом для российского интернета, стал созданный в 1997 году «Яндекс».

Этот российский аналог «Google» стал настоящей гордостью российских программистов. Сегодня, он уверенно теснит конкурента в рунете и также является одним из лидеров по поисковым запросам среди ИПС в России.

На сегодняшний день, имеются многочисленные специальные «поисковики», которые созданы для решения определенных задач. Так, например, информационно – поисковая система «Патрон», разработана для того, чтобы хранить и искать данные по патронам для различного оружия и сейчас применяется, как в органах Министерства Внутренних Дел и спецслужб, так и для охотников – профессионалов и любителей.

Имеются и другие, разработанные для нотариусов, врачей, инженеров, военных, автолюбителей и т д

Как работает ИПС

Работа информационно – поисковой системы является очень сложной. Однако при желании можно разобраться в ее структуре. Первое, что необходимо отметить, что существует особая программа – она называется поисковым роботом (пауком). Данная программа систематически мониторит различные страницы и индексирует их.

Веб сервер создает запрос пользователя на получение той или иной информации, а затем предоставляет данный запрос машине поиска. Поисковик исследует требуемую базу данных, потом составляет полный список страниц, а затем передает веб-серверу. Он в свою очередь окончательно формирует все результаты запроса в «читаемый» вид, затем передает их на «комп» пользователя.

ИПС предназначена для следующих целей:

  • Хранить значительные объемы данных;
  • Производить оперативный поиск нужной информации;
  • Добавлять, а также удалять различные данные;
  • Выводить информацию в простом и удобном виде.

Существуют несколько основных типов ИПС:

  • Автоматизированные
  • Библиографические
  • Диалоговые
  • Документальные

Какие поисковые системы наиболее популярны сегодня?

На первом месте, без всякого сомнения, находиться неотъемлемый лидер – «Google». На сегодняшний день, к нему адресуется около 80 процентов различных мировых запросов по самым различным сферам. Что касается второго места, то его, также заслуженно, занимает американский «eBay».

На третьем месте, наш, отечественный, российский «Яндекс». На четвертом – «Yahoo» и на пятом – MSN. Еще одним отечественным браузером, но занимающим только 10 место в рейтинге Европы – это российский «Rambler».

Google

Этот поисковик знают огромное количество пользователей. На сегодняшний день это первая по популярности система в мире! Ежемесячно она обрабатывает более 41 млрд запросов и проводит индексацию 25 миллиардов страниц.

Что касается истории создания компании «Google», то еще в 1996 году, пара студентов университета Стэнфорда – Ларри Пейдж и Сергей Брин разработали браузер, созданный на новых методах поиска. Назвали они ее просто и лаконично, как собственно и дизайн поисковой системы «Google». Собственно название google – это искаженный googol (число десять в сотой степени).

Читайте также:
Javascript обучение языку программирования для начинающих с нуля

В основе нее специальный поисковый робот, который называется «Googlebot». Он производит сканирование страниц и их индексацию. В качестве алгоритма авторитетности, эта ПС PageRank. Собственно именно он обеспечивает то, как будут выдаваться страницы посетителю в поисковых результатах.

Одним из первых, эта фирма разработала и голосовой поиск на различных языках, который значительно облегчает введение данных в систему. Ну, и наконец, именно этот браузер и послужил основой для слова «гуглить», которое все чаще встречается в сленге молодых тинейджеров.

«Yahoo» – вторая по популярности в США. Ее организовали в 1994 году два аспиранта Стэнфорда – Дэвид Фило и Джерри Янг. В конце 90 –х ими был приобретен портал RocketMail и на основе него создан бесплатный почтовый сервер «Yahoo». Сегодня на ее серверах можно хранить любое количество писем. В 2010 году появляется и русскоязычный ресурс почты – Yahoo! Почта.

Яндекс

Одним из лучших российских поисковиков, вне всякого сомнения, является «Яндекс». На сегодняшний день он стоит на четвертом месте по общему количеству запросов. В то же самое время, по популярности «Яндекс» занимает сегодня первое место в Российской Федерации. Общее количество произведенных запросов превышает 250 миллионов каждый день

Он был представлен в сентябре 1997 года, а уже в мае 2011, произведя размещение своих акций на IPO, эта фирма смогла заработать наибольшее количество акций среди других интернет – компаний.

Сегодня, «Yandex» имеет 50 сервисов, из которых некоторые уникальные – Яндекс.Поиск, Яндекс.Карты, Яндекс.Маркет. Помимо этого, российских пользователей очень интересуют такие сервисы, как «Поиск по блогам», «Яндекс Пробки». Основные запросы для пользователей в основном из следующих стран ближнего зарубежья: Россия, Белоруссия, Турция и Казахстан.

Исторически фирму основал бизнесмен – программист Аркадий Волож в 1989 году. Само название компании было придумано Ильей Сегаловичем, директором «Яндекса». Благодаря сотрудничеству с институтом проблем передачи информации был создан справочный словарь с поиском.

В отличие от других браузеров, Яндекс браузер учитывает и морфологию русского языка. Таким образом, сама система предназначена именно для работы в русскоязычном сегменте интернета.

Начиная с 2010 года, помимо браузера «Yandex.ru» появился еще один поисковик «Yandex.com». Данный интернет – ресурс используется для поиска по зарубежным порталам.

Поисковая система «Ebay»

Ebay представляет собой интернет – компанию из США, которая специализируется на проведении интернет – аукционов. Она производит управление портала eBay.com, а также версиями в других странах мира. Помимо этого, в собственности фирмы есть еще одна eBay Enterprise.

Основателем фирмы является американский программист Пьер Омидьяр, который в середине 90 – х годов разработал интернет – аукцион для своего личного портала. В то же время, eBay – это своего рода посредник при купле продаже. Чтобы использовать его продавцы вносят определенный взнос, а покупатели получают возможность бесплатного использования сайта.

Общие принципы его работы следующие:

  • В основном все люди добропорядочны
  • Каждый может внести свой вклад
  • В открытом общении люди проявляют свои лучшие качества

Уже в 1995 году на тысячах онлайн аукционов продавались миллионы различных предметов. Сегодня, это мощная платформа для купли продажи, как физлицами, так и юрлицами.

С 2010 года возникла и русскоязычная версия популярного ресурса и стала называться «Международный торговый центр eBay». Оплата на аукционе производится через платежную систему «PayPal».

Для того, чтобы продать предметы на данном портале необходимо написать сколько он стоит, его стартовая цена, когда начнутся торги, а также сколько будут длиться торги. Как и в обычном аукционе, выбранный товар получает заплативший самую высокую цену.

Из плюсов подобного аукциона стоит отметить то, что продавец и покупатель могут находиться в любом месте земного шара, а наличие локальных филиалов и временных рамок предоставляют возможность участвовать в аукционах огромному количеству продавцов и покупателей.

MSN

Данная поисковая система является ведущим интернет – браузером, разработанным компанией «Microsoft». Он появился одновременно с выпуском первой операционной системы Windows 95. Далее этим названием стал пользоваться и сервис электронной почты Hotmail, а также различные веб-узлы Майкрософт. В начале 2002 года он являлся одним из самых крупных интернет – провайдеров в США и имел 9 миллионов подписчиков.

Поисковая система Rambler

Вторым крупным российским поисковиком, является интернет – портал «Rambler». По своей сути, вместе с «Яндекс» он является родоначальником рунета, а также главным игроком на рынке медиа услуг.

Основателем его является Сергей Лысаков, который в 1994 году разработала поисковую систему, а в 1996 году был зарегистрирован и домен www.rambler.ru. Начиная с 2012 года, «Рамблер» стал работать, как новостной портал.

Сегодня он имеет 11 место по популярности среди других сайтов РФ. Также, был разработан и специальный классификатор Rambler Top-100. По своей сути он был первый и в России. Сегодня – это удобный каталог объектов недвижимости «Rambler – недвижимость».

Поисковик mail

Одной из самых крупных почтовых служб явилась, созданная в 1998 году, Mail.ru. Сегодня она представляет собой службу электронной почты, каталог интернет – ресурсов и информационные разделы. Помимо очень удобной почты, она имеет ряд специальных проектов, которые весьма популярны и нужны подписчикам: «Авто Mail.ru», Афиша «Mail.ru», «Дети mail.ru», «Здоровье mail.ru», «Леди mail.ru», «Новости mail.ru» и «Недвижимость mail.ru».

Для любителей спорта и Hi-Tech есть соответствующие рубрики.

На этом я завершаю свой материал. Если вам нравилось, то, пожалуйста, подписывайтесь на мой блог и приглашайте своих родных, друзей и знакомых.

Думаю вам будет интересно почитать, как правильно вести свой блог и в интернете, сколько стоит создать блог и еще много другой интересной и полезной информации на моем блоге. Это все. До встречи.

Рейтинг
( Пока оценок нет )
Понравилась статья? Поделиться с друзьями:
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: