Студенческий портал

admin@studynote.ru
/ Регистрация
X
Помощь студенту > Готовые работы > Дипломные работы > Дипломные работы по английскому языку > ФОРМАЛИЗАЦИЯ ПРОЦЕССА ВЫЯВЛЕНИЯ ОСНОВНОГО СОДЕРЖАНИЯ АНГЛОЯЗЫЧНОГО ТЕКСТА

Тема дипломной работы: ФОРМАЛИЗАЦИЯ ПРОЦЕССА ВЫЯВЛЕНИЯ ОСНОВНОГО СОДЕРЖАНИЯ АНГЛОЯЗЫЧНОГО ТЕКСТА

1500 рублей
Купить

или

Заказать новую работу

Более 20 способов оплатить! После оплаты вы получаете ссылку на скачивание. Гарантия на - 3 дня. Исключительно в ознакомительных целях! Все вопросы admin@studynote.ru

  • Общая информация
  • Описание работы
  • Дополнительная информация

    (фрагменты работы)

Учебное заведение: Другие города > ДРУГОЕ
Тип работы: Дипломные работы
Категория: Английский язык, Языкознание и филология
Год сдачи: 2016
Количество страниц: 71
Оценка: 8
Рейтинг работы:

ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ

ГЛАВА 1. ОСНОВНЫЕ ХАРАКТЕРИСТИКИ ТЕКСТА

1.1 Текст: определение и основные характеристики

1.2. Основные единицы текста

1.3. Смысл и содержание текста

Выводы по главе 1

ГЛАВА 2. ПОДХОДЫ К ВЫДЕЛЕНИЮ СОДЕРЖАНИЯ ТЕКСТА

2.1 Подходы к аннотированию текстов

2.2 Способы реферирования текстов

2.3 Статистический метод выделения главных и второстепенных опорных слов текста

Выводы по главе 2

ГЛАВА 3. ИСПОЛЬЗОВАНИЕ СТАТИСТИЧЕСКОГО МЕТОДА ДЛЯ ВЫДЕЛЕНИЯ ОСНОВНОГО СОДЕРЖАНИЯ АНГЛОЯЗЫЧНОГО НАУЧНОГО ТЕКСТА

3.1. Отбор материала для проведения исследования и его статистическая обработка

3.2 Выделение главных и второстепенных слов отобранных текстов

3.3. Создание алгоритма для автоматического реферирования текста

Выводы по главе 3

ЗАКЛЮЧЕНИЕ

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

ПРИЛОЖЕНИЕ А

ПРИЛОЖЕНИЕ Б

ПРИЛОЖЕНИЕ В

ПРИЛОЖЕНИЕ Г

ПРИЛОЖЕНИЕ Д

 

РЕФЕРАТ

          Дипломная работа: ** с., 44 источника, * приложений.

ТЕКСТ, РЕФЕРИРОВАНИЕ, АННОТИРОВАНИЕ, ОПОРНЫЕ СЛОВА, АЛГОРИТМ, СМЫСЛ ТЕКСТА, СОДЕРЖАНИЕ ТЕКСТА.

Объектом исследования дипломной работы является система лингвистических правил, позволяющая выделить некоторое содержание текста.

Предметом исследования в дипломной работе является система лексических и статистических правил, позволяющих извлечь основное содержание (реферата) англоязычного текста.

Целью исследования является создание алгоритма для автоматического построения реферата текста.

Методы исследования: статистический, алгоритмический.

Основные результаты дипломной работы будут представлены в виде опорных слов текста и алгоритма создания реферата текста на базе этих опорных слов.

Область применения. Созданный алгоритм автоматического реферирования текста может быть использован для извлечения основного содержания из научно-технических текстов.

ВВЕДЕНИЕ
Для удовлетворения потребностей человека в большом количестве информации, за последние годы в сфере информационных технологий было сделано немало – созданы и продолжают развиваться различные системы понимания текста компьютером, системы автоматического реферирования и аннотирования текстов, системы порождения текста компьютером.
В современном мире человека окружает огромное количество различной информации. Мы получаем информацию из различных источников: телевидение, радио, интернет, газеты и журналы, книги. В настоящее время так сложилось, что не знать что-либо просто неприлично. Информация и знания – мощный инструмент, определяющий статус человека в обществе, позволяющий достигать успехов в той или иной сфере и др.
Несмотря на развитие высоких технологий и их все более тесное проникновение в жизнь человека, многие люди предпочитают аудиовизуальным источникам информации текстовые. Самым популярным источником получения информации в XXI веке является сеть Интернет. Современному человеку тяжело представить свою жизнь без новостных агрегаторов, новостных порталов, электронных энциклопедий и пр. Как известно, большое количество информации в сети Интернет представлено на английском языке, поэтому темой нашей работы является формализация процесса выявления основного содержания англоязычного текста, и в частности статистический метод выделения основного содержания англоязычных научных текстов.
Статистический метод выделения основного содержания текста достаточно популярен в сфере информационных технологий и служит для выполнения широкого круга задач. Например, данный метод применяется при машинном реферировании и аннотировании текстов, а также используется для категоризации и тегирования новостей на новостных сайтах, при индексировании больших текстов поисковыми системами, с целью выдачи конечному пользователю наиболее релевантных результатов и пр.
Темой дипломной работы является формализация процесса основного содержания англоязычного текста и создание алгоритма для решения этой задачи.
Актуальность темы дипломной работы обусловлена следующими моментами:
1. В современном обществе люди стремятся получить как можно больше информации, затратив на это как можно меньше времени и усилий.
2. Аннотации и рефераты являются популярными источниками получения наиболее важной информации из первоисточников.
3. Автоматическое реферирование и аннотирование становится все более популярным вследствие своей дешевизны и того факта, что компьютеры способны справляться с этой задачей быстрее человека.
4. Разработанный нами алгоритм автоматического реферирования может быть использован для извлечения основного содержания из научно-технических текстов.
Целью исследования является создание алгоритма для автоматического построения реферата текста.
Для достижения данной цели необходимо решить следующие задачи:
• рассмотреть подходы к определению понятия «текст», выявить отличия между понятием «смысл» и «содержание» текста;
• детально рассмотреть подходы к выделению содержания текста;
• отобрать тексты для проведения исследования, выделить в них ключевые слова и с опорой на них создать алгоритм автоматического реферирования текста
Объектом исследования дипломной работы является система лингвистических правил, позволяющая выделить некоторое содержание текста.
Предметом исследования в дипломной работе является лексических и статистических правил, позволяющих извлечь основное содержание (реферата) англоязычного текста.
Материалами для написания дипломной работы послужили работы таких лингвистов как А.В. Зубов, И.Р. Гальперин, А.И. Новиков и др. Практическим материалом для работы стали пять новостных текстов научной тематики на английском языке, взятых с сайта livescience.com.
Методы исследования: статистический, алгоритмический.