Русский язык
<<  Результаты заочного этапа XVI турнира им. М.В. Ломоносова по русскому языку Адаптация художественного текста при обучении русскому языку: интегративный подход  >>
Использование методов извлечения информации при географической
Использование методов извлечения информации при географической
Географическая привязка текстов
Географическая привязка текстов
Неоднозначности географической привязки
Неоднозначности географической привязки
Классификация лексем текста
Классификация лексем текста
Технология классификации лексем
Технология классификации лексем
Обучаемые методы извлечения информации из текстов
Обучаемые методы извлечения информации из текстов
Вероятностные методы
Вероятностные методы
Другие обучаемые методы
Другие обучаемые методы
Эксперимент и оценки
Эксперимент и оценки
Характеристики лексем
Характеристики лексем
Сравнение методов для словарных характеристик
Сравнение методов для словарных характеристик
Сравнение методов для словарных и морфологических характеристик
Сравнение методов для словарных и морфологических характеристик
Сравнение методов для различного числа характеристик
Сравнение методов для различного числа характеристик
Инструмент разметки
Инструмент разметки
Регулярные выражения
Регулярные выражения
Источники данных
Источники данных
Выводы
Выводы

Презентация на тему: «Использование методов извлечения информации при географической привязке текстов на русском языке». Автор: Прокофьев. Файл: «Использование методов извлечения информации при географической привязке текстов на русском языке.pptx». Размер zip-архива: 594 КБ.

Использование методов извлечения информации при географической привязке текстов на русском языке

содержание презентации «Использование методов извлечения информации при географической привязке текстов на русском языке.pptx»
СлайдТекст
1 Использование методов извлечения информации при географической

Использование методов извлечения информации при географической

привязке текстов на русском языке

Прокофьев П.А. (p_prok@mail.ru)

2 Географическая привязка текстов

Географическая привязка текстов

Прокофьев Петр (p_prok@mail.ru)

2

3 Неоднозначности географической привязки

Неоднозначности географической привязки

«город Чехов», но «победа чехов» город Энгельс Саратовской области Алтайский край и Алтайский район Администрация Воронежской области «столица Франции» = «Париж» , «родина японцев» = «Япония» «55 километров от Москвы по Дмитровскому шоссе» = «Дмитров»

Прокофьев Петр (p_prok@mail.ru)

3

4 Классификация лексем текста

Классификация лексем текста

страны федеральные округа России края республики автономные округа области районы города «не география»

Прокофьев Петр (p_prok@mail.ru)

4

5 Технология классификации лексем

Технология классификации лексем

Прокофьев Петр (p_prok@mail.ru)

5

6 Обучаемые методы извлечения информации из текстов

Обучаемые методы извлечения информации из текстов

Вероятностные Maximum Entropy Maximum Entropy Markov Model Conditional Random Fields Support Vector Machine Комбинированный метод

Прокофьев Петр (p_prok@mail.ru)

6

7 Вероятностные методы

Вероятностные методы

Общая задача найти (оценить)

Общая задача найти (оценить)

MaxEnt

MEMM

CRF

Прокофьев Петр (p_prok@mail.ru)

7

8 Другие обучаемые методы

Другие обучаемые методы

SVM Бинарные классификаторы для каждого класса Выбираем класс с большим весом Комбинированный Выбираем класс, определенный методом с лучшими показателями для класса

Прокофьев Петр (p_prok@mail.ru)

8

9 Эксперимент и оценки

Эксперимент и оценки

Набор размеченных текстов 846 текстов 372367 лексем 5431 отмечены как «география» 400 текстов для обучения 446 текста для тестирования Показатели P, R, F-мера Итерации 5 итераций Средний показатель

Прокофьев Петр (p_prok@mail.ru)

9

10 Характеристики лексем

Характеристики лексем

Словарные cлово словари регулярные выражения + предыдущее и следующие Морфологические и графематические регистр падеж число

Прокофьев Петр (p_prok@mail.ru)

10

11 Сравнение методов для словарных характеристик

Сравнение методов для словарных характеристик

233 характеристики

Прокофьев Петр (p_prok@mail.ru)

11

12 Сравнение методов для словарных и морфологических характеристик

Сравнение методов для словарных и морфологических характеристик

285 характеристик

Прокофьев Петр (p_prok@mail.ru)

12

13 Сравнение методов для различного числа характеристик

Сравнение методов для различного числа характеристик

F-мера

Характеристики

Прокофьев Петр (p_prok@mail.ru)

13

14 Инструмент разметки

Инструмент разметки

Прокофьев Петр (p_prok@mail.ru)

14

15 Регулярные выражения

Регулярные выражения

Город

город @%ГОРОД г . @%ГОРОД г @%ГОРОД @%ГОРОД #2 столица %СТРАНА столица %СТРАНА #2 @%ГОРОД житель @%ГОРОД …

Страна

житель @%СТРАНА гражданин @%СТРАНА экономика @%СТРАНА политика @%СТРАНА страна @%СТРАНА граница @%СТРАНА …

Фамилия

@%ФАМИЛИЯ %ИМЯ %ИМЯ @%ФАМИЛИЯ %ИМЯ %ОТЧЕСТВО @%ФАМИЛИЯ *ИНИЦИАЛ . @%ФАМИЛИЯ @%ФАМИЛИЯ *ИНИЦИАЛ . господин @%ФАМИЛИЯ %ПРОФЕССИЯ @%ФАМИЛИЯ …

Легенда

@ - Текущая лексема

%(Словарь) – лексема в словаре

*(Предикат) – проверка предиката для лексемы

#(Число слов) – любые слова

Прокофьев Петр (p_prok@mail.ru)

15

16 Источники данных

Источники данных

Прокофьев Петр (p_prok@mail.ru)

16

17 Выводы

Выводы

Обучаемые методы позволяют улучшить результаты разрешения неоднозначностей Наибольшее влияние оказывает состав признаков, а не методы классификации Направление исследований Методы поиска информативных характеристик Методы разрешения неоднозначностей с использованием глобального контекста

Прокофьев Петр (p_prok@mail.ru)

17

«Использование методов извлечения информации при географической привязке текстов на русском языке»
http://900igr.net/prezentacija/russkij-jazyk/ispolzovanie-metodov-izvlechenija-informatsii-pri-geograficheskoj-privjazke-tekstov-na-russkom-jazyke-145715.html
cсылка на страницу

Русский язык

25 презентаций о русском языке
Урок

Русский язык

100 тем
Слайды
900igr.net > Презентации по русскому языку > Русский язык > Использование методов извлечения информации при географической привязке текстов на русском языке