или
Заказать новую работу(фрагменты работы)
Учебное заведение: | Другие города > ДРУГОЕ |
Тип работы: | Дипломные работы |
Категория: | Английский язык, Языкознание и филология |
Год сдачи: | 2016 |
Количество страниц: | 71 |
Оценка: | 8 |
Дата публикации: | 28.10.2018 |
Количество просмотров: | 289 |
Рейтинг работы: |
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ
ГЛАВА 1. ОСНОВНЫЕ ХАРАКТЕРИСТИКИ ТЕКСТА
1.1 Текст: определение и основные характеристики
1.2. Основные единицы текста
1.3. Смысл и содержание текста
Выводы по главе 1
ГЛАВА 2. ПОДХОДЫ К ВЫДЕЛЕНИЮ СОДЕРЖАНИЯ ТЕКСТА
2.1 Подходы к аннотированию текстов
2.2 Способы реферирования текстов
2.3 Статистический метод выделения главных и второстепенных опорных слов текста
Выводы по главе 2
ГЛАВА 3. ИСПОЛЬЗОВАНИЕ СТАТИСТИЧЕСКОГО МЕТОДА ДЛЯ ВЫДЕЛЕНИЯ ОСНОВНОГО СОДЕРЖАНИЯ АНГЛОЯЗЫЧНОГО НАУЧНОГО ТЕКСТА
3.1. Отбор материала для проведения исследования и его статистическая обработка
3.2 Выделение главных и второстепенных слов отобранных текстов
3.3. Создание алгоритма для автоматического реферирования текста
Выводы по главе 3
ЗАКЛЮЧЕНИЕ
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
ПРИЛОЖЕНИЕ А
ПРИЛОЖЕНИЕ Б
ПРИЛОЖЕНИЕ В
ПРИЛОЖЕНИЕ Г
ПРИЛОЖЕНИЕ Д
РЕФЕРАТ
Дипломная работа: ** с., 44 источника, * приложений.
ТЕКСТ, РЕФЕРИРОВАНИЕ, АННОТИРОВАНИЕ, ОПОРНЫЕ СЛОВА, АЛГОРИТМ, СМЫСЛ ТЕКСТА, СОДЕРЖАНИЕ ТЕКСТА.
Объектом исследования дипломной работы является система лингвистических правил, позволяющая выделить некоторое содержание текста.
Предметом исследования в дипломной работе является система лексических и статистических правил, позволяющих извлечь основное содержание (реферата) англоязычного текста.
Целью исследования является создание алгоритма для автоматического построения реферата текста.
Методы исследования: статистический, алгоритмический.
Основные результаты дипломной работы будут представлены в виде опорных слов текста и алгоритма создания реферата текста на базе этих опорных слов.
Область применения. Созданный алгоритм автоматического реферирования текста может быть использован для извлечения основного содержания из научно-технических текстов.
(фрагменты работы)
ВВЕДЕНИЕ
Для удовлетворения потребностей человека в большом количестве информации, за последние годы в сфере информационных технологий было сделано немало – созданы и продолжают развиваться различные системы понимания текста компьютером, системы автоматического реферирования и аннотирования текстов, системы порождения текста компьютером.
В современном мире человека окружает огромное количество различной информации. Мы получаем информацию из различных источников: телевидение, радио, интернет, газеты и журналы, книги. В настоящее время так сложилось, что не знать что-либо просто неприлично. Информация и знания – мощный инструмент, определяющий статус человека в обществе, позволяющий достигать успехов в той или иной сфере и др.
Несмотря на развитие высоких технологий и их все более тесное проникновение в жизнь человека, многие люди предпочитают аудиовизуальным источникам информации текстовые. Самым популярным источником получения информации в XXI веке является сеть Интернет. Современному человеку тяжело представить свою жизнь без новостных агрегаторов, новостных порталов, электронных энциклопедий и пр. Как известно, большое количество информации в сети Интернет представлено на английском языке, поэтому темой нашей работы является формализация процесса выявления основного содержания англоязычного текста, и в частности статистический метод выделения основного содержания англоязычных научных текстов.
Статистический метод выделения основного содержания текста достаточно популярен в сфере информационных технологий и служит для выполнения широкого круга задач. Например, данный метод применяется при машинном реферировании и аннотировании текстов, а также используется для категоризации и тегирования новостей на новостных сайтах, при индексировании больших текстов поисковыми системами, с целью выдачи конечному пользователю наиболее релевантных результатов и пр.
Темой дипломной работы является формализация процесса основного содержания англоязычного текста и создание алгоритма для решения этой задачи.
Актуальность темы дипломной работы обусловлена следующими моментами:
1. В современном обществе люди стремятся получить как можно больше информации, затратив на это как можно меньше времени и усилий.
2. Аннотации и рефераты являются популярными источниками получения наиболее важной информации из первоисточников.
3. Автоматическое реферирование и аннотирование становится все более популярным вследствие своей дешевизны и того факта, что компьютеры способны справляться с этой задачей быстрее человека.
4. Разработанный нами алгоритм автоматического реферирования может быть использован для извлечения основного содержания из научно-технических текстов.
Целью исследования является создание алгоритма для автоматического построения реферата текста.
Для достижения данной цели необходимо решить следующие задачи:
• рассмотреть подходы к определению понятия «текст», выявить отличия между понятием «смысл» и «содержание» текста;
• детально рассмотреть подходы к выделению содержания текста;
• отобрать тексты для проведения исследования, выделить в них ключевые слова и с опорой на них создать алгоритм автоматического реферирования текста
Объектом исследования дипломной работы является система лингвистических правил, позволяющая выделить некоторое содержание текста.
Предметом исследования в дипломной работе является лексических и статистических правил, позволяющих извлечь основное содержание (реферата) англоязычного текста.
Материалами для написания дипломной работы послужили работы таких лингвистов как А.В. Зубов, И.Р. Гальперин, А.И. Новиков и др. Практическим материалом для работы стали пять новостных текстов научной тематики на английском языке, взятых с сайта livescience.com.
Методы исследования: статистический, алгоритмический.
Похожие работы
Работы автора