Без темы
<<  Awk Axial and Appendicular Skeleton  >>
Картинок нет
Картинки из презентации «AWK (GAWK). (Манипулирование файлами данных, выборка и обработка текста )» к уроку на тему «Без темы»

Автор: Petrikov_Vladimir. Чтобы познакомиться с картинкой полного размера, нажмите на её эскиз. Чтобы можно было использовать все картинки для урока , скачайте бесплатно презентацию «AWK (GAWK). (Манипулирование файлами данных, выборка и обработка текста ).ppt» со всеми картинками в zip-архиве размером 51 КБ.

AWK (GAWK). (Манипулирование файлами данных, выборка и обработка текста )

содержание презентации «AWK (GAWK). (Манипулирование файлами данных, выборка и обработка текста ).ppt»
Сл Текст Сл Текст
1AWK (GAWK). (Манипулирование файлами 27том числе и "Ивановский
данных, выборка и обработка текста ). машиностроительный завод" ).
Преподаватель: Петриков Владимир Позволяет более точно описать класс строк,
Дмитриевич. которые необходимо обработать или
2Инструмент прикладного программиста: напечатать. см. Пример 3. Шаблон.
строковый процессор AWK. The AWK 28ИСТИНА и ЛОЖЬ в AWK. Из C. ИСТИНА -
programming language, авторы aho, любое число, отличное от 0 или любая
weinberger и kernighan известны, как непустая строка. ЛОЖЬ – число 0 или пустая
родоначальники языка C и операционной строка “”. "0" – истина , т.К.
системы UNIX. Gawk - это GNU реализация Строка не пустая.
AWK mawk, … - новый AWK. много реализаций 29Выражение отношения. <
- разные ОС: UNIX, WIN, MAC. Выражение> < Принадлежность> <
3Пример 1. Разбор файлов задачного Выражение> < Выражение> < Лог.
сервера 2006 -2008. Имеется Набор Операция> < Выражение> ~
каталогов со сданными решениями и набор Содержится !~ Не содержится. < <= ==
файлов с протоколами результатов != >= > n >= 5. $0 ~ /Иванов/. $1
Необходимы файлы – по именам студентов по >= "s" в строке содержится
номерам задач. “Иванов”. Шаблон. s, t, u, v... Строки,
4Значительная обычная доля работы начинающиеся с символа s или следующих за
программиста - преобразовании текстовых ним по порядку.
файлов: выделении из них определенных 30&& Логическое И || Логическое
частей, преобразовании одних строк в ИЛИ ! Логическое НЕ (отрицание).
другие, дописывании какой-либо информации, Логические операции. < Выражение>
простейшие вычисления с данными, < Лог. Операция> < Выражение>
извлекаемыми из этих файлов и т.д., и т.п. $0 ~ /Иванов/ || $0 ~ /Петров/. n >= 5
Трудоемкость - тысячи строк текста && n<10. в строке содержится
Неунифицируемость - информация не “Иванов” или “Петров”. n = 5, 6, 7, 8, 9.
структурирована Для эффективной работы в Шаблон.
этой ''серой'' области давно предложен и с 31BEGIN и END. BEGIN { }. Входной файл.
успехом применяется строковый процессор Программа. END { }. BEGIN { printf
awk. “СТАРТ\n” } /Иванов/ END { printf
5Пример 2. Преобразование Списка для “\nФИНИШ”}. Шаблон. Выполняется 1 раз.
разных задач. Выполняется много раз = количеству строк.
6Почти C. Для своих действий awk Выполняется 1 раз.
предоставляет в распоряжение программиста 32Метасимволы (шаблоны). ^ $ [ ] - + *
развитый язык программирования, .(Точка) \. Регулярное выражение.
напоминающий популярный язык /Иванов/. ^ -- соответствует началу строки
программирования C. Входной язык /^A/ - строки, начинающиеся на A $4 ~
процессора awk является в определенном /^Иванов/ $ -- соответствует концу строки.
смысле ''упрощенным'' C , предоставляя /A$/ отвечает строкам, заканчивающимся на
удобный операционный синтаксис для A. $4 ~ /вна$/. "^$"
строковых операций, автоматическое Соответствует пустой строке. Шаблон.
преобразование строка-число, 33[ ] -- множество единичных символов
автоматический лексический разбор входного [AWK] соответствует множеству из трех букв
потока и т.п. A, W, K G[AWK] представляет множество
7Бонус. Одна из самых замечательных строк { GA, GW, GK } - -- задаёт диапазон
особенностей Perl состоит в том, что он символов (нет переносимости POSIX!) [a-z]
представляет собой семантическое соответствует символам от a до z, {a b c d
надмножество (как минимум) языка awk. С … y z} $4 ~ /^[А-С]/. Шаблон.
практической точки зрения это значит, что 34+ -- Многократное ( не менее одного)
если вы можете сделать что-либо в awk, вы повторение в образце символа,
сможете сделать это и в Perl. предшествующего + [1-9]00+ -- целые числа,
8Запуск awk-программы. Если программа делящиеся на 100 {100 200 …900 1000 …} *
короткая, проще всего включить ее в -- также многократное, но возможно также и
команду выполнения awk: Linux: awk нулевое повторение предыдущего символа.
'program' input-file1 input-file2 ... WIN: [1-9][0-9]* -- положительные целые числа.
gawk “program” input-file1 input-file2 ... {1 2 … 10 …100 …} [1-9]00* -- целые числа,
Если программа длинная, обычно удобнее делящиеся на 10 {10 20 …90 100 …} ? --
записать ее в файл : gawk -f program-file однократное, но возможно также и нулевое
input-file1 input-file2 ... Нет повторение предыдущего символа.
input-file1. Ввод со стандартного [1-9][0-9]? -- Положительные целые числа
устройства ввода ( win: клавиатура , до 99 {1 2 … 10 …99}. Шаблон.
CTRL-Z ). 35.(Точка) -- произвольный единичный
9Технология выполнения заданий. ОС: символ .* - обозначает произвольную
windows. Файловый менеджер: Total комбинацию символов. "13." - 131
Commander. Задание : в отдельном каталоге. 133 134 13_ 13\n 13 \ -- отменяет
Набор файлов: Zapusk.bat gawk -f p2.awk специальное значение последующего символа.
spisok.txt > new.txt. Запуск примера из \$ - Это символ $ \\ - это символ \.
командного окна текущего каталога: набрать Шаблон.
в TotalCommander внизу - cmd Запуск: 36Управляющие последовательности. Для
>zapusk. Редактируем файл p2.awk. символов ASCII с кодами 0 - 31. \a 0x07
10Файл. - Именованная последовательность BEL Звуковой сигнал Bell \b 0x08 BS Забой
логических записей, хранящихся на внешнем Back Space \f 0x0C FF Перевод бланка Form
носителе. Предыдущая запись. Следующая Feed \n 0x0A LF Новая строка (перевод
запись (RECORD). Запись конца файла. строки) (new line) Line Feed \r 0x0D CR
Текущая позиция. Запись - набор знаков, Возврат каретки Caridge Return \t 0x09 HT
значений; читается или записывается Табуляция (горизонтальная) \v 0x0B VT
целиком. Вертикальная табуляция.
11Работа awk. AWK рассматривает входной 37Символы, используемые в разных
поток данных : это записи (строки), «шаблонах». printf("Hello Word !!!
разделенные специальными символами (RS - \n"); Универсальный способ. \Ddd
RecordSeparator) - переход на новую строку строка до трех восьмеричных цифр (0 - 377)
('\n'). Запись (строка) считается \xdd строка шестнадцатеричных цифр (0 -
разделенной на поля специальными символами FF). Как напечатать \ “ ? \\ 0x5c \
(FS - FieldSeparator) - по умолчанию - Обратная наклонная черта \/ / Прямая
символ пробела Строка <= 256 символов. наклонная черта \' 0x27 ' Одинарная
$0. \n. Пробел. кавычка (апостроф) \" 0x22 "
12Структура awk-файла. Программа на Двойная кавычка \? 0x3F ? Вопросительный
языке awk состоит из пар: образец знак.
действие. (шаблон действие) Каждая 38
запись проверяется встроенным механизмом 39Действие. Предложения, разделенные ;
awk на соответствие заданному образцу и или \n (новая строка). Вывод (Печать)
если текущая запись соответствует этому Присваивание n = 1 Управляющая структура
образцу, выполняется действие. , т.е. Встроенная функция.
интерпретация входной информации идёт 40Вывод (Печать). Print - выводится вся
построчно. …………. Входной Файл …………. запись + \n print $0. Print $1, $2 -
Программа. см. Пример 3 - запуск из файла. значения полей выводятся через пробел.
Выполняется много раз. Print $1 “abc” - выводится конкатенация
13Шаблон { действие }. Шаблон. { значений полей. Print “” – выводится
Действие }. Шаблон { print }. /Иванов/. { пустая строка. Формат вывода – по
if( $0 ~ /Иванов/ ) print $0 }. Действие умолчанию. Действие.
выполняется для каждой записи. Вывод всей 41printf format, item1, item2, ...
записи для каждого шаблона. Чего-то нет. Функция sprintf(format, item1, item2,
Сравним примеры 3 и 3а. ...). Форматированный вывод. Действие.
14Общее в AWK. Образец {действие}. -- 42Управляющие операторы. If (условие)
Поля (см.выше) для входных записей -- оператор [ else оператор] while (условие)
Переменные (стандартные, Массивы) -- оператор do оператор while (условие) for
Арифметические выражения. Допускается (выражение1; выражение2; выражение3)
использование в. оператор for (переменная in массив)
15Образец (шаблон). -- Регулярное оператор break continue delete
выражение -- Выражение отношения -- массив[индекс] delete массив exit [
Комбинация образцов -- BEGIN и END. выражение ] { операторы }. Действие.
16Действие. Предложения, разделенные ; 43If (если). If( условие ) действие. If(
или \n (новая строка). Вывод (Печать) условие ) действие else действие. Анализ
Присваивание Управляющая структура условия на истинность, == 0. if (x % 2 ==
Встроенная функция. 0) print "x is even" else print
17 "x is odd" Действие.
18Комментарии. - Начинаются с символа 44While (пока). While (условие )
``#'' и продолжаются до конца строки. # действие. Выполнение действия пока
Print list of word frequencies { for (i = значение условия != 0 проверка перед
1; i <= NF; i++) freq[$i]++ # массив каждым выполнением. { i = 1 while( i <=
слов } END { for (word in freq) printf 3) { print $i i=i+1 } }. Действие.
"%s\t%d\n", word, freq[word] }. 45Do (делай ). Do действие while (
Общее в awk. pr4 pr4a. условие ). { i = 1 do { print $0 i++ }
19Поля. строка ВВОДА состоит из полей. while (i <= 10) }. Действие.
строка: Первоеполе Второеполе ……… $0 $1 $2 46For (для). Инициализация задает
…. $100 $101. Ссылается на всю строку инициализацию цикла while (условие)
целиком. Запись (строка) считается проверка перед каждой итерацией { действие
разделенной на поля специальными символами приращение часть итерации }. For
(FS - FieldSeparator) - по умолчанию - (инициализация; условие; приращение)
символ пробела. Максимально. Общее в awk. действие. for (i = 1; i <= 100; i = i +
20Поля. NR – Number of Record. NF – 2) print i. Действие.
number of fields число полей. Номер 47For (для). For (переменная in массив)
строки. Record: Первоеполе Второеполе ……… действие. # Пишем 1 для каждого встречного
Последнееполе $0 $1 $2 …. gawk “{ print NR слова { for (i = 1; i <= NF; i++)
}” new.txt. gawk “{ print NR NF}” new.txt. used[$i] = 1 }. # Ищем количество разных
Общее в awk. !!! Вывод Без пробела: NRNF. слов длиннее 10 знаков END { for (x in
21Переменные. Умолчание. X = 1 - число. used) if (length(x) > 10) { num = num
= 0. X = “ab” - строка. = “”. Y + “abc” - +1 } print num, "words longer than 10
число. Y “abc” - строка. Общее в awk. characters" }. Действие.
22Поля как переменные. $1 = 48break. continue. Break (прерывание) –
"3" + $2. Используем значение «досрочный» выход из цикла. - Для do,
поля. Меняем значение поля. n = 5 $(n+1). while, for. Continue (продолжение) – новая
Вычисляемый номер поля. Общее в awk. итерация - выполнение нового цикла.
23Массивы. # Подсчёт частоты слов { for Действие.
(i = 1; i <= NF; i++) freq[$i] = 49Встроенные функции. Математические
freq[$i] +1 # массив «слов» }. Общее в функции exp() – экспонента log() -
awk. Не объявляются. { x[1] = 1 x[3] = $0 натуральный логарифм sqrt() - квадратный
} END{ print x[1] print x[3] }. корень int() - целая часть числа.
Используются элементы массива, «как Действие.
переменные». Индексация не числом, а полем 50Строковые функции. length(arg) -
(строкой). Функция длины arg. length - длина текущей
24Арифметические выражения. + - * / % строки substr(s, m, n) - Возвращает
Остаток. Выражение < Операция> подстроку строки s, начиная с позиции m,
Выражение. Операция склейка строк. X = 1.2 всего n символов. index(s, t) - Возвращает
- число. z = “ab” “cde”. z = “abcde”. X = начальную позицию подстроки t в строке s.
“ab” - строка. Переменная (Число - Строка) (Или 0, если t в s не содержится.).
Число Строка Встроенная функция Выражение. Действие.
(Константы). Общее в awk. Константы. 51sprintf(fmt,exp1,exp2,...) -
Строка строка. форматированная печать (вывод) в строку,
25 идентично PRINTF split(s, array, sep) -
26Образец (шаблон). -- Регулярное Помещает поля строки s в массив array и
выражение -- Выражение отношения -- возвращает число заполненных элементов
Комбинация образцов -- BEGIN и END. массива. Если указан sep, то при анализе
27Регулярное выражение. Программа ( с строки он понимается как разделитель.
пустым действием) /Иванов/ напечатает из Действие.
текстового файла те строки, которые 52
содержат подстроку "Иванов" ( в 53
AWK (GAWK). (Манипулирование файлами данных, выборка и обработка текста ).ppt
http://900igr.net/kartinka/bez_uroka/awk-gawk.-manipulirovanie-fajlami-dannykh-vyborka-i-obrabotka-teksta-72802.html
cсылка на страницу

AWK (GAWK). (Манипулирование файлами данных, выборка и обработка текста )

другие презентации на тему «AWK (GAWK). (Манипулирование файлами данных, выборка и обработка текста )»

«Цифровая обработка сигналов» - У.М. Сиберт. Информационные источники. План лекции. Основные разделы ЦОС. Аппаратная и программная реализация. Направления развития ЦОС. Определение. Конспект лекций. arctan. Предмет курса. sin. Цифровая обработка сигналов. Типовая блок-схема устройства ЦОС. Цифровая обработка сигналов: лекция 1. cos.

«Магнитное поле сила Ампера» - Использование силы Ампера. Определите направление силы, действующей на проводник с током со стороны магнитного поля. Характеристика магнитного поля. где В - магнитная индукция, F – сила, I – сила тока, ?l – длина проводника. Магнитное поле. Направление вектора магнитной индукции. Сила Ампера. Модуль вектора магнитной индукции.

«Воспитание культуры общения» - Общая тенденция. Воспитание культуры общения. Формы внеурочной работы. Молодой человек. Педагогическая практика. Контактное и дистантное. Взаимные отношения. Показатель уровня образования. Коммуникация. Культура общения формируется в школе. Ориентировка в окружающих условиях. Общение. Общению нужно учиться.

«Природный и попутный газ» - Первая стадия обработки извлеченного из недр газа – осушка. Основные направления химических превращений алканов. Газ, основное промышленное сырье для производства водорода. Уничтожение попутных газов. Рассмотрим развитие газовой промышленности в нашей стране. В топливном балансе дореволюционной России, природный газ совсем не использовался.

«Нейтрон» - Важный вклад сделали в 1932 Ирен и Фредерик Жолио-Кюри. Открытие нейтрона (1932) принадлежит физику Дж. Античастицей нейтрона является антинейтрон, который не совпадает с самим нейтроном. Нейтро?н — элементарная частица, не имеющая заряда. Основные характеристики. Нейтрон. Открытие нейтрона.

«Экологические риски» - Дано: функция полезности: u(x)=. Система стандартов ISO 14000. Задачи ИЭРДП: Средство контроля, планирования и управления природоохранных усилий. Риск – опасность отклонения от желаемого результата. Структура стандартов сери ISO 14000. Через функцию полезности u(x) может быть выражена склонность к риску.

Без темы

23685 презентаций
Урок

Без урока

1 тема
Картинки
900igr.net > Презентации по > Без темы > AWK (GAWK). (Манипулирование файлами данных, выборка и обработка текста )