Тема 1. Информатика и информационные процессы
1.1. Основные понятия информатики
Во второй половине 20 века человечество вступило в новый этап своего развития. В этот период начался переход от индустриального общества к информационному. Процесс, обеспечивающий этот переход, получил название информатизации.
Информатизация – это процесс создания и всеобщего применение информационных средств и технологий, обеспечивающих достижение и поддержание такого уровня информированности всех членов общества, какой необходим и достаточен для кардинального улучшения качества труда и условий жизни в обществе. При этом информация становится важнейшим стратегическим ресурсом общества и занимает ключевое место в экономике, образовании и культуре.
Научным фундаментом процесса информатизации общества является учебный предмет информатика – техническая научная дисциплина о процессах сбора, хранения и переработки информации. Рассмотрим основные понятия информатики.
Сигналы и данные. Мы живем в материальном мире, состоящем из физических тел или полей, которые постоянно изменяются и взаимодействуют друг с другом. Эти взаимодействия сопровождаются обменом веществом и энергией. Каждый такой обмен имеет определённые внешние проявления, которые называются сигналом. Выработка сигналов сопровождаются появлением следов взаимодействий, в результате чего возникают определенные изменения свойств взаимодействующих объектов. Это явление называется регистрацией сигналов. Так образуются данные – зарегистрированные в каком-нибудь виде сигналы.
Информация и её носитель. Поскольку каждое изменение свойств определяется какой-нибудь особенностью события, в результате которого был выработан сигнал, то каждое данное несет определенные сведения, позволяющие что-то узнать об этих событиях. Так, анализ предметов, найденных в результате археологических раскопок, позволяет с достаточной достоверностью воссоздать особенности быта людей живших когда-то на этом месте; изучив следы на земле, опытный охотник-следопыт сможет подробно рассказать, что за животное здесь прошло, было ли оно спокойно или его потревожили, здоровое оно или больное и многое другое. Подобные сведения, полученные в результате переработки данных, называются информацией.
Иными словами, информация является некоторым связующим звеном между материальными объектами и нематериальным человеческим сознанием, благодаря которому люди получают возможность узнавать окружающий мир.
Следует подчеркнуть, что информация – категория нематериальная, и для своего существования и распространения в материальном мире нуждается в какой-либо материальной основе. Материальный объект или среда, которые служат для регистрации или передачи данных называют материальными носителями информации. Носителем информации могут быть весьма разнообразные предметы, в том числе и человеческая память. Достаточно длительное время в истории человечества универсальным носителем информации являлась бумага. В настоящее время широко используются магнитные носители, в которых чередуются намагниченные и ненамагниченные участки. Намагниченный участок соответствует 1, а ненамагниченный – 0.
Как было сказано, благодаря материальному носителю информацию можно хранить и передавать на расстояние. При этом хранение информации связано с некоторой характеристикой носителя, которая не меняется с течением времени. Например, намагниченные области поверхности диска или написанные на бумаге буквы могут сохраняться в неизменном виде произвольное длительное время. Передача же информации – наоборот, связана с характеристикой, которая меняется с течением времени. Например, это может быть изменение амплитуды и частоты звуковых колебаний (так информация передаётся посредством человеческой речи) или изменение напряжения и частоты колебаний переменного тока в электрических проводах (так информация передается по телефону или телеграфу) и т.д. Последовательность сигналов, порождённая изменением во времени состояния носителя информации называется сообщением.
Алгоритм и знание. Однако, имея данные или сообщение, не всегда можно извлечь из них информацию. Например, прослушав передачу радиостанции на незнакомом языке, мы получаем данные в результате прослушивания, но не получаем информацию, т.к. никаких сведений мы из передачи не извлекли. Это произошло потому, что нам не известен язык, на котором велась передача. Иными словами, мы не знаем метода преобразования полученных данных в известные нам понятия. Следовательно, информация – это продукт взаимодействия данных и подходящего (адекватного) к ним метода переработки. В информатике такие методы называются алгоритмами.
Информация, полученная в результате переработки данных, воспринимается людьми, для которых эта информация предназначается – пользователями информации. В результате восприятия информации пользователи могут повышать свою осведомленность о чем-либо, т.е. они вырабатывают знания. Знание – такая форма развития осведомленности о каком-нибудь объекте или явлении, которую можно употребить с пользой для себя и окружающих. В результате получения новых знаний люди могут применить их на практике и разработать более совершенные средства воздействия на природу, изменяя ее для улучшения условий своей жизни.
Информационные процессы (кратко). Перечисленные понятия, их взаимосвязь и происходящие с ними изменения можно изобразить в виде схемы, приведенной на рис. 1.1.
И н ф о р м а т и к а |
Изменение окружающей среды |
Вещество, энергия |
Применение знаний |
Знания |
Восприятие информации |
Информация |
Данные |
Обработка данных |
Данные |
Сигналы |
Окружающая среда |
Приборы и документы |
Сбор данных |
Носители информации |
Хранение данных |
Компьютеры |
Пользователи информации |
Машины и производственные технологии |
Рис. 1.1. Круговорот информации в природе |
В тех случаях, когда некоторое качество, характеризующее объект меняется с течением времени, используется термин «процесс». На схеме отражены основные изменения, происходящие с информацией, следовательно, эти изменения можно назвать информационными процессами. Какие же изменения могут происходить с нематериальной информацией? Очевидно, меняться может либо её содержание, либо материальная оболочка, посредством которой информация представлена. Поэтому различают два типа информационных процессов:
- изменение сообщений и данных с сохранением содержащейся в них информации;
- изменение сообщений и данных с преобразованием содержащейся в них информации.
К процессам первого типа относится передача информации в пространстве или времени (хранение информации). К процессам второго типа относятся создание информации, уничтожение информации и обработка с появлением новой информации или знания.
На схеме выделена область, определяющая место информатики в этом круговороте и составляющая ее предмет – процессы сбора, хранения и обработки данных. Часто вместе с перечисленными процессами рассматривают процесс передачи данных. Рассмотрим эти процессы подробнее.
1.2. Информационные процессы: подробности
1.2.1. Процесс сбора данных
Как было сказано в п. 1.1, каждое изменение свойств любого объекта имеет какую-нибудь особенность, в результате которой вырабатывается определенный сигнал. Съём и регистрация этих сигналов представляет собой процесс сбора данных. Он производится либо с помощью датчиков, встроенных в исследуемый объект, либо путем считывания данных с документов.
В общем случае сигналы, поступающие от объекта можно разделить на статические и динамические. Статические сигналы отражают устойчивое состояние объекта, не меняющееся во времени и обычно фиксируются в форме документов. Динамические сигналы меняются во времени и обычно представляются в форме электрических сигналов на выходе датчиков и контрольно-измерительных приборов.
По характеру изменения сигналы делятся на непрерывные и дискретные.
|
Непрерывные математически отображаются непрерывными функциями времени. Физически они представляют собой непрерывные значения тока или напряжения (см. рис. 1.2 – красная линия). Дискретные сигналы определяются конечным множеством значений тока или напряжения. Каждое из возможных значений дискретного сигнала можно обозначить каким-нибудь кодом и в таком виде хранить и использовать его в компьютере.
Схема процесса сбора данных при использовании датчика представлена на рис. 1.3. С объекта датчиком снимается непрерывный сигнал, который в преобразователе превращается в дискретный, а в шифраторе дискретный сигнал кодируется, например, в виде двоичного кода – последовательности из 0 и 1. Физически код представляет собой последовательность электрических импульсов, передаваемых по проводам. Наличие тока означает 1, отсутствие – 0. Полученные наборы данных собираются в накопителе – временное хранилище данных, из которого они выводятся по мере необходимости.
Существует несколько способов превращения непрерывного сигнала в дискретный, наиболее распространенные – квантование по уровню или по времени. В обоих случаях график исходного сигнала в виде плавной непрерывной кривой заменяется ступенчатой линией.
Аналого-цифровой преобразователь |
Датчик |
Объект |
Преобразователь |
Накопитель |
Рис. 1.3. Общая схема процесса сбора данных |
Шифратор |
В первом способе весь диапазон значений непрерывного сигнала разбивается на несколько участков. Если величина сигнала попадает в какой-то i-й участок, то значение квантованного сигнала принимается равным граничному или среднему значению этого участка.
При втором способе на части разбивается временной интервал изменения сигнала. Значением квантованного сигнала на каждом j-м участке считается величина непрерывного сигнала в начале этого участка или в его середине (см. рис. 1.2.).
При съёме данных с документа преобразователь уже не нужен, т.к. исходный сигнал является дискретным, а роль накопителя выполняет непосредственно компьютер, в котором данные будут храниться. Схема процесса – на рис. 1.4.
1.2.2. Процесс хранения данных.
Напомним, что данными называются зарегистрированные в каком-нибудь виде сигналы. В данных содержатся сведения, характеризующие какой-либо объект или явление. Большинство данных не используется непосредственно, а подвергается обработке. Понятно, что эта обработка не может быть осуществлена немедленно после получения данных, а должно пройти определённое время, пока данных не накопится достаточное количество или в обработке каких-то конкретных данных не возникнет необходимость. Весь период времени между поступлением данных и началом их использования данные подвергаются хранению. Хранение данных – передача информации во времени.
Клавиатура |
Накопитель |
Рис. 1.4. Процесс съёма данных с документа |
| |||
Свойства данных. Для понимания особенностей процесса хранения рассмотрим основные свойства, которыми обладают данные.
1. Важнейшим из их свойств является тип данных. Тип данных определяет:
- множество значений, которые может принимать данное;
- форму представления данных в ЭВМ;
- совокупность операций, допустимых над данными;
- правила доступа к ним (т.е. извлечения с места хранения).
Допустимый набор типов данных и их особенности определяются программной системой, имеющейся в компьютере и работающей с данными. Ясно, что чем более широким и гибким оказывается набор используемых типов данных, тем больше возможностей предоставляется пользователю в решении задач представления, хранения и применения данных.
2. Следующим признаком является деление данных на простые (одиночные) и сложные (структурированные). Данные простого типа содержит только одну компоненту – одно число или один символ. Данные сложных типов могут содержать несколько компонент простого типа. Таким образом, простые данные являются теми «кирпичиками», путём объединения которых строятся сложные данные.
3. В зависимости от того, на каком этапе обработки данные используются, они подразделяются на исходные (входные), промежуточные и выходные. К исходным относятся данные, необходимые для исполнения программы и вводимые в неё до или в процессе работы. Эти данные могут быть предварительно записаны на некотором носителе и вводиться с него, а также могут поступать по линии связи от каких-то датчиков или с других компьютеров, а могут вводиться непосредственно пользователем программы с помощью устройства ввода (клавиатуры).
Промежуточные данные формируются в ходе исполнения программы и, чаще всего, пользователю недоступны. Они не отображаются на устройствах вывода, но существуют во внутренней или внешней памяти компьютера.
Выходные данные являются конечным результатом работы программы – ради них и производится обработка входных данных. Выходные данные, предназначенные для человека, представляются в требуемом для него формате (тексты, рисунки, звуки и т.д.).
Способы представления данных в компьютере. Для представления значений простых данных во внутренней памяти компьютера используют так называемое машинное слово – совокупность двоичных элементов, обрабатываемых как единое целое в устройствах и памяти компьютера. С технической точки зрения машинное слово объединяет запоминающие элементы, служащие для записи 0 или 1 (одного двоичного разряда) в единую ячейку памяти. Первый микропроцессор Intel-4004, созданный в конце 1970 года фирмой Intel работал с 4-разрядными ячейками. В настоящее время наибольшее распространение получили компьютеры с 32-разрядными ячейками (см. рис. 1.5), однако существуют компьютеры и иной разрядности. Доступ к машинному слову в операциях записи и считывания осуществляется по номеру ячейки памяти, который называется адресом ячейки.
№ разряда | 31-й разряд | 30-й разряд | 29-й разряд | 28-й разряд | … | … | … | 2-й разряд | 1-й разряд | 0-й разряд |
Содержимое | 0 | 0 | 1 | 1 | … | … | … | 1 | 0 | 1 |
Рис. 1.5. 32-разрядное машинное слово
Для представления символов (литерных данных) машинное слово делится на группы по 8 разрядов, в каждую из которых записывается двоичный код символа. Ясно, что в 32-разрядном машинном слове можно записать 4 символа. В представлении целых чисел используется уже все 32 разряда, а для представления одного вещественного (дробного) числа, например, в языке PASCAL используются целых две ячейки.
Пусть в задаче требуется обработать большое количество однотипных данных. Это можно сделать различными способами.
Например, первый способ: запрашивать данные по одному и обрабатывать. Недостаток: на текущий момент доступно только одно текущее значение, для повторной обработки придется запросить все данные повторно.
Второй способ: объявить столько переменных, сколько данных понадобится. Недостаток: обрабатывать все данные надо одинаково, и программа будет содержать повторяющийся набор однотипных действий, отличающихся только именем переменной, хранящей очередное значение.
Поэтому необходимы структуры, позволяющие хранить однотипные данные и одинаково их обрабатывать. Именно по этой причине в современных компьютерах используются сложные (структурированные) данные. Наиболее простой структурой является массив. Массив – это структура данных одинакового типа, упорядоченных по номерам. Для его хранения во внутренней памяти компьютера отводится непрерывная область, содержащая столько ячеек, сколько необходимо для размещения всех элементов массива.
Другой часто используемой структурой данных является логическая запись. Логическая запись – разнородная совокупность простых данных, имеющая смысловую завершённость. Иными словами, логическая запись объединяет не любые разрозненные по своему содержанию (смыслу) данные, а те, которые характеризуют некий объект. Пример записи – строка списка студентов:
Фамилия | Год рождения | Год поступления в ВУЗ | Курс | Номер зачётной книжки |
Рис. 1.6. Пример логической записи
Простые данные, совокупность которых образует запись, называются полями записи. Данные в виде совокупности логических записей могут храниться во внутренней памяти компьютера, но чаще они используются для представления данных во внешней памяти. В этом случае они объединены в файл. Файл – совокупность однородных записей, хранящихся во внешней памяти компьютера. Файлы могут объединяться в каталоги. В операционных системах семейства Windows каталоги называются папками.
Основные фазы процесса хранения информации:
- организация информационных массивов;
- запись данных на носитель;
- реализация алгоритмов ввода, поиска, обновления и вывода информации.
Начиная со средины 60-х годов 20 века, для хранения информации все шире используют так называемые базы данных – централизованные хранилища информации, доступные многим пользователям. Они предоставляют широкий спектр операций по хранению, поиску и манипулированию данными.
При долговременном хранении больших объемов данных используют так называемое сжатие или архивацию данных – запись данных в таком формате, при котором они занимают меньше места, чем при обычном формате хранения.
Устройства хранения информации. Устройства, выполняющие операции, связанные с сохранением и считывания данных на материальном носителе называются внешними запоминающими устройствами (ВЗУ) или устройствами внешней памяти. Любое ВЗУ реализует один из двух возможных принципов размещения информации – последовательный или прямой доступ. Первый вариант используется при сохранении информации на ленточных носителях. В этом случае записи размещаются одна за другой, т.е. последовательно. Считывание записей также производится последовательно, и для того, чтобы отыскать нужную запись, требуется просмотреть все предыдущие. В настоящее время в качестве устройств последовательного доступа используются стримеры.
PRIVATE<TBODY>Стример (англ. tape streamer) — устройство для резервного копирования больших объёмов информации. В качестве носителя здесь применяются кассеты с магнитной лентой. Стримеры позволяют записать на небольшую кассету с магнитной лентой огромное количество информации. Встроенные в стример средства аппаратного сжатия позволяют автоматически уплотнять информацию перед её записью и восстанавливать после считывания, что увеличивает объём сохраняемой информации. Недостатком стримеров является их сравнительно низкая скорость записи, поиска и считывания информации.</TBODY>
Для реализации прямого доступа на носителе должны быть пронумерованы области записи информации, такие области называются блоками. Обратиться к данному, записанному в определённом блоке, можно по номеру блока. Операция разбиения поверхности носителя на блоки называется форматированием, она обязательно делается перед использованием носителя.
К устройствам прямого доступа относятся магнитные диски и компакт-диски.
PRIVATE "TYPE=PICT;ALT=Винчестерский накопитель"
Рис. 1.7. Винчестерский накопитель со снятой крышкой корпуса
PRIVATE<TBODY>Накопитель на жёстких магнитных дисках (англ. HDD — Hard Disk Drive) или винчестер — это наиболее массовое запоминающее устройство большой ёмкости, в котором носителями информации являются круглые алюминиевые пластины – платтеры, обе поверхности которых покрыты слоем магнитного материала. Используется для постоянного хранения информации — программ и данных. </TBODY>
PRIVATE "TYPE=PICT;ALT=Поверхность магнитного диска"
Рис. 1.8. Поверхность магнитного диска
Информация записывается по концентрическим дорожкам (трекам), которые делятся на секторы. Сектор хранит минимальную порцию информации, которая может быть записана на диск или считана. Ёмкость сектора постоянна и составляет 512 байтов.
Накопитель на компакт-дисках (CD-ROM) состоит из прозрачной полимерной основы диаметром 12 см и толщиной 1,2 мм. Одна сторона покрыта тонким алюминиевым слоем, защищенным от повреждений слоем лака. Двоичная информация представляется последовательным чередованием углублений (pits — ямки) и основного слоя (land — земля). Участки CD, на которых записаны символы "0" и "1", отличаются коэффициентом отражения лазерного луча, посылаемого накопителем CD-ROM. Эти отличия улавливаются фотоэлементом, и общий сигнал преобразуется в соответствующую последовательность нулей и единиц.
Достоинства CD-ROM:
- При малых физических размерах CD-ROM обладают высокой информационной ёмкостью, что позволяет использовать их в справочных системах и в учебных комплексах с богатым иллюстративным материалом
- Считывание информации с CD происходит с высокой скоростью, сравнимой со скоростью работы винчестера;
- CD просты и удобны в работе, практически не изнашиваются;
- CD не могут быть поражены вирусами;
- С CD-ROM невозможно случайно стереть информацию;
- Стоимость хранения данных (в расчете на 1 Мбайт) низкая.
1.2.3. Процесс передачи данных
Необходимость в передаче данных возникает, когда объекты, между которыми происходит обмен информацией, территориально удалены друг от друга. В современных информационных системах обмен происходит с использованием коммуникационной сети. На рис. 1.9 изображена структура (строение) современного канала связи, используемого в процессе передачи данных.
Основные проблемы процесса передачи данных:
1) согласование физических характеристик сигнала (частота, амплитуда) с физическими характеристиками непрерывного канала связи для обеспечения минимального затухания сигнала при его передаче на большие расстояния;
2) сведение к минимуму потери информации при передаче по дискретному каналу, на который воздействуют помехи;
3) решение задачи маршрутизации, т.е. доставление информации адресату по каналу передачи данных в максимально короткий срок.
Поясним суть этих проблем и укажем методы их решения.
1). Физической средой передачи данных является канал связи, в котором элементы данных передаются в виде электрических сигналов. Он называется непрерывным каналом, т.к. проходящие в нем сигналы описываются непрерывными функциями времени. Большинство непрерывных каналов не могут передавать сигналы без их предварительного преобразования. Для такого преобразования в структуре канала предусмотрено специальное преобразующее устройство. Для телефонных каналов связи это устройство называется модем (от слов «модулятор» и «демодулятор»). С помощью модулятора происходит воздействие на входной сигнал, благодаря чему он смещается в диапазон таких частот, для которых наблюдается наименьшее затухание амплитуды сигнала в выбранном непрерывном канале, поэтому модулированный сигнал проходит по каналу с минимальной потерей мощности. Демодулятор осуществляет обратное преобразование, т.е. переход от модулированного сигнала к обычному.
Оконечное оборудование |
Источник сообщения |
Дешифратор + Устройство защиты от ошибок |
Устройство сопряжения |
Приемник сообщения |
Устройство сопряжения |
Непрерывный канал |
Шифратор + Устройство защиты от ошибок |
Модем |
Модулятор |
Демодулятор |
Модем |
Оконечное оборудование |
К а н а л п е р е д а ч и д а н н ы х |
Дискретный канал |
Рис. 1.9. Структура канала связи |
2). Для того, чтобы сообщение можно было передать по каналу связи, его надо закодировать, т.е. преобразовать в совокупность таких сигналов, которые удобно передавать на расстояние. Модулятор, непрерывный канал и демодулятор (на другом конце канала) образуют дискретный канал, на вход которого подаются сообщения в виде набора закодированных сигналов, а на выходе эти сообщения считываются и декодируются. Кодирование и декодирование производится шифратором и дешифратором, каждый из которых снабжен устройством защиты от ошибок, которое производит эти преобразования так, чтобы свести к минимуму искажение информации от помех, воздействующих на канал. Достигается эта минимизация за счет применения специальных помехоустойчивых кодов. В них в основное сообщение встраиваются специальные контрольные символы. Если сообщение будет содержать ошибку, то ее можно будет распознать и исправить. Подобной помехозащищенностью обладают, в частности, и естественные языки. В них каждое слово содержит больше информации, чем необходимо передать. Благодаря подобной избыточности информации можно восстанавливать пропущенные буквы в кроссвордах или старинных рукописях.
3). Необходимость решения задачи маршрутизации возникает из-за того, что каналы связи имеют ограниченную пропускную способность, т.е. существует некоторый предел количества информации, которое по ним можно передать. С другой стороны, коммуникационные сети проектируются так, что между двумя фиксированными узлами можно проложить несколько возможных маршрутов. В процессе функционирования сети загруженность ее отдельных участков постоянно меняется. Поэтому при передаче каждого сообщения производится поиск такого пути (маршрута) прохождения сигнала, по которому можно передать сообщение в кратчайший срок и без потери информации.
1.2.4. Процесс обработки данных
Обработка – процесс преобразования информации к такому виду, из которого можно получить знание.
Преобразования, производимые в процессах сбора, передачи и хранения (кодирование, сжатие и т.д.) – это перезапись одной и той же информации, представление ее в разных формах. Ничего нового из этой информации не появляется. В процессе же обработки из имеющейся информации появляется нечто новое.
Пример 1.1. Митя и Алеша вместе собрали 40 грибов. Митя собрал на 10 грибов больше, чем Алеша. Сколько грибов собрал каждый мальчик?
Для того чтобы ответить на этот вопрос, надо решить систему уравнений:
(1.1)
Решить ее, т.е. обработать данную информацию, можно, например, методом Крамера.
Шаг 1. Вычислим определитель матрицы системы D = 1×(–1) – 1×1 = – 2. Он не равен 0, значит, система имеет решение.
Шаг 2. Вычислим определители для каждого неизвестного: DА = 10 – 40 = – 30; DМ = – 40 – 10 = – 50.
Шаг 3. Вычисляем каждое неизвестное: ;
Ответ: Митя собрал 25 грибов, а Алеша – 15.
Иными словами, процесс обработки информации состоит из отдельных шагов. В результате выполнения каждого шага возникает порция новой информации.
Как было сказано в п. 1.1, описание пошагового процесса обработки информации называется алгоритмом.
Более подробно об алгоритмах поговорим в следующей теме.
Тема 2. Алгоритмизация и программирование
2.1. Алгоритм и его свойства
Что такое алгоритм. PRIVATE<TBODY>Алгоритм – точная и понятная инструкция исполнителю совершить некую последовательность действий, направленн… Продолжение »