Урок 5
§5. Передача и хранение информации
Содержание урока:
![]() | 5.2. Хранение информации | ![]() |
| Объём переданной информации (продолжение) | ![]() | САМОЕ ГЛАВНОЕ Вопросы и задания |
5.2. Хранение информации


Основным носителем информации для человека является его собственная память. По отношению к человеку все прочие виды носителей информации можно назвать внешними.
Основное свойство человеческой памяти — быстрота, оперативность воспроизведения хранящейся в ней информации. Но наша память не надёжна: человеку свойственно забывать информацию. Хотя психологи утверждают, что из памяти человека ничего не исчезает, тем не менее человек довольно часто теряет способность к воспроизведению некоторых знаний. Именно для более надёжного хранения информации человек использует внешние носители, организует внешние хранилища информации.
Виды внешних носителей менялись со временем: в древности это были камень, дерево, папирус, кожа и др. Долгие годы основным носителем информации была бумага. Развитие компьютерной техники привело к созданию магнитных (магнитная лента, гибкий магнитный диск, жёсткий магнитный диск), оптических (CD, DVD, BD) и других современных носителей информации.
В настоящее время наиболее надёжными носителями информации, записанной цифровым способом, являются оптические диски.
Применение оптического способа записи началось в 1980-х годах. Тогда и появились оптические диски, иначе называемые компакт-дисками (CD), Процесс записи и считывания информации таких дисков осуществляется при помощи лазера. Информационная ёмкость CD составляет от 190 до 700 MB.
Во второй половине 1990-х годов появились цифровые многоцелевые диски DVD, информационная ёмкость которых измерялась уже в гигабайтах (до 17 GB). DVD имеют такой же размер, как и CD, но для записи и считывания данных в них применяется лазер с меньшей длиной волны, что обеспечивает более плотную структуру рабочей поверхности, позволяя хранить и считывать больший объём информации.
В конце 2000-го года впервые был представлен Blu-ray Disc (BD) — оптический носитель, используемый для записи с повышенной плотностью хранения цифровых данных, включая видео высокой чёткости. Коммерческий запуск BD, положивший начало его широкому распространению, был осуществлён в 2006 году. В BD для записи и чтения данных используется коротковолновый (405 нм) сине-фиолетовый лазер. Это позволяет при сохранении физических размеров CD и DVD (12 см) увеличить информационную ёмкость BD до 50 GB и более.
Какая основная тенденция прослеживается в развитии оптических носителей информации? Сформулируйте её и попробуйте обосновать.
В последние годы появились и получили широкое распространение всевозможные мобильные электронные (цифровые) устройства: планшетные компьютеры, смартфоны, устройства для чтения электронных книг, GPS-навигаторы и др. Появление таких устройств стало возможно, в том числе, благодаря разработке принципиально новых носителей информации, которые:
• обладают большой информационной ёмкостью при небольших физических размерах;
• характеризуются низким энергопотреблением при работе, обеспечивая наряду с этим высокие скорости записи и чтения данных;
• энергонезависимы при хранении;
• имеют долгий срок службы.
Всеми этими качествами обладает флеш-память (англ. flash-mеmоrу). Выпуск построенных на их основе флеш-накопителей, называемых в просторечии «флешками», был начат в 2000 году. Сегодня широко используются флеш-накопители от 8 GB до 128 GB.
В настоящее время активно ведутся работы по созданию ещё более компактных носителей информации на основе нанотехнологий, имеющих дело с молекулами и атомами вещества. По предположениям экспертов приблизительно через 15-20 лет плотность хранения информации возрастёт настолько, что на носитель с физическими размерами в 1 см3 можно будет записать каждую секунду человеческой жизни.
Современные системы хранения информации, центральным звеном которых являются носители информации или запоминающие устройства, включают в себя также инструменты поиска (поисковые системы) и средства отображения информации (устройства вывода). Такие системы хранения информации определённого назначения (определённой предметной области) представляют собой базы данных, банки данных и базы знаний.
В этом параграфе при разговоре об информационной ёмкости носителей мы использовали обозначения MB и GB для таких единиц, как мегабайт и гигабайт. Не показалось ли вам это необычным, тем более что в предыдущем параграфе мы говорили об обозначениях Мбайт и Гбайт?
Дело в том, что многие современные операционные системы продолжают придерживаться принципа, что 1 килобайт равен 1024 байт, в то время как производители запоминающих устройств считают его равным 1000 байт. Если на CD или другом носителе информации вы видите надпись, например, 700 MB, то понимать приставку «мега» здесь следует в традиционном математическом смысле, а именно:
700 MB = 700 • 10 3 КВ = 700 • 10 3 • 10 3 байт = 700 000 000 байт.
Cкачать материалы урока
Информатика. 10 класс
Конспект урока
Информатика, 10 класс. Урок № 4.
Тема — Обработка информации. Передача и хранение информации
Перечень вопросов, рассматриваемых в теме: обработка информации, кодирование, поиск информации, передача информации, хранение информации
Глоссарий по теме: обработка информации, кодирование, код, префиксный код, пропускная способность, объем информации, носитель информации
Основная литература по теме урока:
Л. Л. Босова, А. Ю. Босова. Информатика. Базовый уровень: учебник для 10 класса —
М.: БИНОМ. Лаборатория знаний, 2016
Дополнительная литература по теме урока:
И. Г. Семакин, Т. Ю. Шеина, Л. В. Шестакова Информатика и ИКТ. Профильный уровень: учебник для 10 класса — М.: БИНОМ. Лаборатория знаний, 2010
К. Ю. Поляков, Е. А. Еремин Информатика. Углубленный уровень: учебник для 10 класса: в 2 ч. Ч. 1. — М.: Бином, Лаборатория знаний, 2013
Теоретический материал для самостоятельного изучения:
В основе любой информационной деятельности лежат так называемые информационные процессы — совокупность последовательных действий (операций), производимых над информацией для получения какого-либо результата (достижения цели). Информационные процессы могут быть различными, но все их можно свести к трем основным: обработка информации, передача информации и хранение информации.
Обработка информации — это целенаправленный процесс изменения формы ее представления или содержания.
Из курса информатики основной школы вам известно, что существует два различных типа обработки информации:
— кодирование — переход от одной формы представления информации к другой, более удобной для восприятия, хранения, передачи или последующей обработки; один из вариантов кодирования — шифрование, цель которого — скрыть смысл информации от посторонних;
— структурирование — организация информации по некоторому правилу, связывающему ее в единое целое (например, сортировка);
— поиск и отбор информации, требуемой для решения некоторой задачи, из информационного массива (например, поиск в словаре).
Общая схема обработки информации может быть представлена следующим образом:
Исходные данные — это информация, которая подвергается обработке.
Правила — это информация процедурного типа. Они содержат сведения для исполнителя о том, какие действия требуется выполнить, чтобы решить задачу.
Исполнитель — тот объект, который осуществляет обработку. Это может быть человек или компьютер. При этом человек, как правило, является неформальным, творчески действующим исполнителем. Компьютер же способен работать только в строгом соответствии с правилами, т.е. является формальным исполнителем обработки информации.
Рассмотрим отдельные процессы обработки информации более подробно.
Кодирование информации — это обработка информации, заключающаяся в ее преобразовании в некоторую форму, удобную для хранения, передачи, обработки информации в дальнейшем.
Код — это система условных обозначений (кодовых слов), используемых для представления информации.
Кодовая таблица — это совокупность используемых кодовых слов и их значений.
Нам уже знакомы примеры равномерных двоичных кодов — пятиразрядный код Бодо и восьмиразрядный код ASCII.
Самый известный пример неравномерного кода — код Морзе. В этом коде все буквы и цифры кодируются в виде различных последовательностей точек и тире.
Чтобы отделить коды букв друг от друга, вводят еще один символ — пробел (пауза). Например, слово «byte», закодированное с помощью кода Морзе, выглядит следующим образом:
При использовании неравномерных кодов важно понимать, сколько различных кодовых слов они позволяют построить.
Пример 1. Имеющаяся информация должна быть закодирована в четырехбуквенном алфавите . Выясним, сколько существует различных последовательностей из 7 символов этого алфавита, которые содержат ровно пять букв А.
Нас интересует семибуквенная последовательность, т. е.
Если бы у нас не было условия, что в ней должны содержаться ровно пять букв А, то для первого символа было бы 4 варианта, для второго — тоже 4, и т. д.
Тогда мы получили бы: 4 · 4 · 4 · 4 · 4 · 4 · 4 = 16384 варианта.
Теперь вернемся к имеющемуся условию и заполним пять первых мест буквой А. Получим:
Так как на 6-м и 7-м местах могут стоять любые из трех оставшихся букв B, C, D, то всего существует 9 (3 · 3) вариантов последовательностей.
Но ведь буквы А могут находиться на любых пяти из семи имеющихся позиций. А сколько таких вариантов всего?
Вспоминая комбинаторику, найдем число сочетаний 
Главное условие использование неравномерных кодов — возможность однозначного декодирования записанного с их помощью сообщения. Именно поэтому в технических системах широкое распространение получили особые неравномерные коды — префиксные коды.
Префиксный код — код со словом переменной длины, обладающий тем свойством, что никакое его кодовое слово не может быть началом другого (более длинного) кодового слова.
Условие, определяющее префиксный код, называется прямым условием Фано (в честь Роберта Марио Фано), и позволяет однозначно декодировать сообщения, записанные с помощью неравномерных кодов.
Также достаточным условием однозначного декодирования неравномерного код является обратное условие Фано. В нем требуется, чтобы никакой код не был окончанием другого (более длинного) кода.
Пример 2. Двоичные коды для 5 букв латинского алфавита представлены в таблице:
Выясним, какое сообщение закодировано с помощью этих кодов двоичной строкой: 0110100011000.
Можно заметить, что для заданных кодов не выполняется прямое условие Фано:
А вот обратное условие Фано выполняется: никакое кодовое слово не является окончанием другого. Следовательно, имеющуюся строку нужно декодировать справа налево (с конца). Получим
01 10 100 011 000 = BDCEA
Для построения префиксных кодов удобно использовать бинарные деревья, в которых от каждого узла отходят только два ребра, помеченные цифрами 0 и 1.
Пример 3. Для кодирования некоторой последовательности, состоящей из букв А, Б, В и Г, решили использовать неравномерный двоичный код, позволяющий однозначно декодировать полученную двоичную последовательность. При этом используются такие кодовые слова: А — 0, Б — 10, В — 110. Каким кодовым словом может быть закодирована буква Г? Если таких слов несколько, укажите кратчайшее из них.
Построим бинарное дерево:
Чтобы найти код символа, нужно пройти по стрелкам от корня дерева к нужному листу, выписывая метки стрелок, по которым мы переходим.
Определим положение букв А, Б и В на этом дереве, зная их коды. Получим:
Чтобы код был префиксным, ни один символ не должен лежать на пути от корня к другому символу. Уберем лишние стрелки:
На получившемся дереве можно определить подходящее расположение буквы Г и его код.
Задача поиска обычно формулируется следующим образом. Имеется некоторое хранилище информации — информационный массив (телефонный справочник, словарь, расписание поездов, диск с файлами и др.). Требуется найти в нем информацию, удовлетворяющую определенным условиям поиска (телефон какой-то организации, перевод слова, время отправления поезда, нужную фотографию и т. д.). При этом, как правило, необходимо сократить время поиска, которое зависит от способа организации данных и используемого алгоритма поиска.
Алгоритм поиска, в свою очередь, также зависит от способа организации данных.
Если данные никак не упорядочены, то мы имеем дело с неструктурированным набором данных. Для осуществления поиска в таком наборе применяется метод последовательного перебора.
При последовательном переборе просматриваются все элементы подряд, начиная с первого. Поиск при этом завершается в двух случаях:
— искомый элемент найден;
— просмотрен весь набор данных, но искомого элемента среди них не нашлось.
Зададимся вопросом: какое среднее число просмотров приходится выполнять при использовании метода последовательного перебора? Есть два крайних случая:
— искомый элемент оказался первым среди просматриваемых. Тогда просмотр всего один;
— искомый элемент оказался последним среди просматриваемых. Тогда количество просмотров равно N, где N — размер набора данных. Столько же просмотров нам придется выполнить даже если не сможем найти искомого элемента.
Если же провести поиск последовательным перебором достаточно много раз, то окажется, что в среднем на поиск требуемого элемента уходит N/2 просмотров. Эта величина определяет длительность поиска — главную характеристику поиска.
Если же информация упорядочена, то мы имеем дело со структурой данных, в которой поиск осуществляется быстрее, можно построить оптимальный алгоритм.
Одним из оптимальных алгоритмов поиска в структурированном наборе данных может быть метод половинного деления.
Напомним, что при этом методе искомый элемент сначала сравнивается с центральным элементом последовательности. Если искомый элемент меньше центрального, то поиск продолжается аналогичным образом в левой части последовательности. Если больше, то — в правой. Если же значения искомого и центрального элемента совпадают, то поиск завершается.
Пример 4. В последовательности чисел 61 87 180 201 208 230 290 345 367 389 456 478 523 567 590 требуется найти число 180.
Процесс поиска представлен на схеме:
Передача информации — это процесс распространения информации от источника к приемнику через определенный канал связи.
На рисунке представлена схема модели процесса передачи информации по техническим каналам связи, предложенная Клодом Шенноном.
Работу такой схемы можно пояснить на примере записи речи человека с помощью микрофона на компьютер.
Источником информации является говорящий человек. Кодирующим устройством — микрофон, с помощью которого звуковые волны (речь) преобразуются в электрические сигналы. Канал связи — провода, соединяющие микрофон и компьютер. Декодирующее устройство — звуковая плата компьютера. Приемник информации — жесткий диск компьютера.
При передаче сигнала могут возникать разного рода помехи, которые искажают передаваемый сигнал и приводят к потере информации. Их называют «шумом».
В современных технических системах связи борьба с шумом (защита от шума) осуществляется по следующим двум направлениям:
Но чрезмерная избыточность приводит к задержкам и удорожанию связи. Поэтому очень важно иметь алгоритмы получения оптимального кода, одновременно обеспечивающего минимальную избыточность передаваемой информации и максимальную достоверность принятой информации.
В современных системах цифровой связи для борьбы с потерей информации часто применяется следующий приём. Всё сообщение разбивается на порции — блоки. Для каждого блока вычисляется контрольная сумма, которая передаётся вместе с данным блоком. В месте приёма заново вычисляется контрольная сумма принятого блока, и если она не совпадает с первоначальной, то передача данного блока повторяется.
Важной характеристикой современных технических каналов передачи информации является их пропускная способность — максимально возможная скорость передачи информации, измеряемая в битах в секунду (бит/с). Пропускная способность канала связи зависит от свойств используемых носителей (электрический ток, радиоволны, свет). Так, каналы связи, использующие оптоволоконные кабели и радиосвязь, обладают пропускной способностью, в тысячи раз превышающей пропускную способность телефонных линий.
Скорость передачи информации по тому или иному каналу зависит от пропускной способности канала, а также от длины закодированного сообщения, определяемой выбранным алгоритмом кодирования информации.
Современные технические каналы связи обладают, перед ранее известными, целым рядом достоинств:
— высокая пропускная способность, обеспечиваемая свойствами используемых носителей;
— надёжность, связанная с использованием параллельных каналов связи;
— помехозащищённость, основанная на автоматических системах проверки целостности переданной информации;
— универсальность используемого двоичного кода, позволяющего передавать любую информацию — текст, изображение, звук.
Объём переданной информации I вычисляется по формуле:
где v — пропускная способность канала (в битах в секунду), а t — время передачи.
Рассмотрим пример решения задачи, имеющей отношение к процессу передачи информации.
Пример 5. Документ объемом 10 Мбайт можно передать с одного компьютера на другой двумя способами.
А. Передать по каналу связи без использования архиватора.
Б. Сжать архиватором, передать архив по каналу связи, распаковать.
Какой способ быстрее и насколько, если:
— средняя скорость передачи данных по каналу связи составляет 2 18 бит/с;
— объем сжатого архиватором документа равен 25% от исходного объема;
— время, требуемое на сжатие документа — 5 секунд, на распаковку — 3 секунды?
Для решения данной задачи диаграмма Гантта не нужна; достаточно выполнить расчёты для каждого из имеющихся вариантов передачи информации.
Рассмотрим вариант А. Длительность передачи информации в этом случае составит:
Рассмотрим вариант Б. Длительность передачи информации в этом случае составит:
Итак, вариант Б быстрее на 232 с.
Сохранить информацию — значит тем или иным способом зафиксировать её на некотором носителе.
Носитель информации — это материальная среда, используемая для записи и хранения информации.
Основным носителем информации для человека является его собственная память. По отношению к человеку все прочие виды носителей информации можно назвать внешними.
Основное свойство человеческой памяти — быстрота, оперативность воспроизведения хранящейся в ней информации. Но наша память не надёжна: человеку свойственно забывать информацию. Именно для более надёжного хранения информации человек использует внешние носители, организует внешние хранилища информации.
Виды внешних носителей менялись со временем: в древности это были камень, дерево, папирус, кожа и др. Долгие годы основным носителем информации была бумага. Развитие компьютерной техники привело к созданию магнитных (магнитная лента, гибкий магнитный диск, жёсткий магнитный диск), оптических (CD, DVD, BD) и других современных носителей информации.
В последние годы появились и получили широкое распространение всевозможные мобильные электронные (цифровые) устройства: планшетные компьютеры, смартфоны, устройства для чтения электронных книг, GPS-навигаторы и др. Появление таких устройств стало возможно, в том числе, благодаря разработке принципиально новых носителей информации, которые:
Всеми этими качествами обладает флеш-память (англ. flash-memory). Выпуск построенных на их основе флеш-накопителей, называемых в просторечии «флэшками», был начат в 2000 году.
Сохранение информации
Проблемы сохранения информации
В настоящее время остро стоит проблема сохранения накопленной человечеством информации. Информация на электронных носителях подвергается различным рискам: ломается техника, постоянно меняются сами носители, разъемы для них, от электромагнитного импульса, вспышки на Солнце и т.д. информация может вообще исчезнуть с электронных носителей.
Поэтому нужно придумать более долговечный способ сохранения информации, продублировать этим способом уже существующую. Возможно, следует создавать печатные книги на сверхпрочной бумаге, пластиковые книги или др. Известно, что информация может храниться в кристалле, воде, на заряде молнии.
Ведь былые цивилизации придумали удачные способы хранения информации: папирусы, глиняные таблички, высеченные на скалах и камнях изображения, расположение и геометрия пирамид, древних городов, зашифровка информации в мифах и легендах, знаках, символах и др.
Современному человечеству необходимо прилагать осознанные целенаправленные действия по сохранению той электронной информации, которая уже накапливается музеями, библиотеками, архивами и другими институтами памяти и которая пока еще по разным причинам остается за пределами их внимания.
Речь идет как об электронной информации, порожденной самими учреждениями культуры в результате оцифровки своих фондов, создания баз данных и каталогов, подготовки электронных изданий и пр., так и о чисто виртуальной информации, зарождающейся и существующей только в Интернете.
Целью сохранения электронной информации является обеспечение долговременной (или вечной) доступности цифровых материалов, с сохранением всех смысловых и функциональных характеристик исходных материалов, возможностей поиска, презентации и интерпретации для последующего доступа и использования.
Без специальных усилий по сохранению цифрового культурного наследия, объем и разнообразие которого постоянно увеличиваются, оно будет неизбежно и довольно быстро утрачено.
С резким увеличением объемов электронных информационных ресурсов возникли серьезные проблемы нового качества, которые необходимо учитывать при принятии решений о создании цифровых массивов данных. Речь идет о задачах архивирования и сохранности документов в цифровых библиотеках нового поколения.
Стремительный (лавинообразный) рост объемов информационных ресурсов можно объяснить следующими причинами:
Сохранение цифровой информации требует постоянных усилий и дополнительных значительных финансовых вложений.
На международном уровне задачам долговременного сохранения электронной информации и доступа к ней, большое внимание уделяет ЮНЕСКО.
Постепенно прилагаемые усилия начинают приносить некоторые результаты. В последнее время разрабатываются программы сохранения электронной информации в библиотеках.
Электронная информация может быть утрачена на этапе ее создания и использования, еще до того, как появляется необходимость перехода на новые технологические платформы. Поэтому сохранение и обеспечение доступа к электронным объектам и системам необходимо подразделять на:
Современные методы сохранения цифровых объектов:
Комплекс организационных мероприятий при сохранении электронной информации в процессе создания и использования должен предусматривать:
Долговременное сохранение электронной информации должно предусматривать создание специальных хранилищ или отдельных помещений, обеспечивающих:
Сохранение электронных материалов требует гораздо больших непрерывных усилий, времени, денег, чем сохранение и реставрация традиционных носителей, и проблемы сохранения носят принципиально другой характер. До сих пор можно прочитать документы, созданные несколько тысячелетий тому назад, но цифровые объекты, созданные всего десять лет назад, находятся под угрозой полного исчезновения, и в результате может наступить электронный «темный век».
Традиционные носители информации разрушаются постепенно, и это дает время на то, чтобы провести консервацию и реставрацию. Электронная информация исчезает мгновенно (например, при отключении электричества или поломке носителя), и чаще всего восстановить ее уже невозможно. Поэтому, оценив риски и возможные потери, необходимо принимать превентивные меры по сохранению информации.
В число факторов, в результате действия которых электронные информационные ресурсы (в том числе имеющие непреходящую ценность) могут быть безвозвратно утеряны для будущих поколений, входят:
Основная причина возможной утраты электронной информации, а часто и реальных потерь состоит в том, что отсутствует осознание проблемы на всех уровнях. Как следствие, не обеспечиваются должная организация процессов сохранения электронной информации на всех этапах ее жизненного цикла и наличие критической массы взаимозаменяемых специалистов, способных реализовать эти процессы.























