Форматы данных: представление и кодирование информации в компьютере

Автор работы: Пользователь скрыл имя, 10 Декабря 2012 в 15:55, курсовая работа

Краткое описание

При вводе в компьютер каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран или печать) для восприятия человеком по этим числам строятся изображения букв. Соответствие между набором букв и числами называется кодировкой символов.

Содержание

ВВЕДЕНИЕ …………………………………………………………….. 3
1. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ. ФОРМАТЫ ДАННЫХ: ПРЕД-СТАВЛЕНИЕ И КОДИРОВАНИЕ ИНФОРМАЦИИ В КОМПЬЮТЕРЕ
1.1. Компьютерное кодирование чисел ………………………………. 4
1.2. Компьютерное кодирование текста ……………………………… 6
1.3. Компьютерное кодирование графики ……………………………. 8
1.4. Компьютерное кодирование звука ……………………………….. 10
2. ПРАКТИЧЕСКАЯ ЧАСТЬ. ВАРИАНТ 5
2.1. Постановка задачи ………………………………………………… 13
2.2. Описание алгоритма решения задачи ……………………………. 14
ЗАКЛЮЧЕНИЕ ………………………………………………………… 17
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ ……………………. 18

Вложенные файлы: 1 файл

Информатика.doc

— 596.50 Кб (Скачать файл)



МИНИСТЕРСТВО ОБРАЗОВАНИЯ  И НАУКИ РОССИЙСКОЙ

ФЕДЕРАЦИИ

Государственное образовательное  учреждение высшего профессионального образования

ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ  ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ 

ИНСТИТУТ

КАФЕДРА ПРИКЛАДНОЙ ИНФОРМАТИКИ

 

 

 

 

 

 

 

КУРСОВАЯ РАБОТА

По дисциплине «Информатика»

На тему: «Форматы данных: представление и кодирование  информации в компьютере»

 

 

 

Исполнитель:

Специальность: Финансы и Кредит

Группа:

Номер зачетной книжки:

Руководитель:

 

 

 

 

СОДЕРЖАНИЕ

 

 

 

Стр.

ВВЕДЕНИЕ ……………………………………………………………..

3

1. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ.  ФОРМАТЫ ДАННЫХ: ПРЕДСТАВЛЕНИЕ И КОДИРОВАНИЕ  ИНФОРМАЦИИ В КОМПЬЮТЕРЕ

 

1.1. Компьютерное кодирование  чисел ……………………………….

4

1.2. Компьютерное кодирование  текста ………………………………

6

1.3. Компьютерное кодирование  графики ……………………………. 

8

1.4. Компьютерное кодирование  звука ………………………………..

10

2. ПРАКТИЧЕСКАЯ ЧАСТЬ.  ВАРИАНТ 5

 

2.1. Постановка задачи  …………………………………………………

13

2.2. Описание алгоритма  решения задачи …………………………….

14

ЗАКЛЮЧЕНИЕ …………………………………………………………

17

СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ …………………….

18


 

 

 

 

 

 

 

 

 

 

 

 

 

ВВЕДЕНИЕ

 

Кодирование информации - это процесс формирования определенного  представления информации. При кодировании  информация представляется в виде дискретных данных. Декодирование является обратным к кодированию процессом. В более узком смысле под термином «кодирование» часто понимают переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки. Компьютер может обрабатывать только информацию, представленную в числовой форме. Вся другая информация (например, звуки, изображения, показания приборов и т. д.) для обработки на компьютере должна быть преобразована в числовую форму. С помощью программ для компьютера можно выполнить обратные преобразования полученной информации.

При вводе в компьютер каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран или печать) для восприятия человеком по этим числам строятся изображения букв. Соответствие между набором букв и числами называется кодировкой символов.

Знаки или символы  любой природы, из которых конструируются информационные сообщения, называют кодами. Полный набор кодов составляет алфавит кодирования. Как правило, все числа в компьютере представляются с помощью нулей и единиц (а не десяти цифр, как это привычно для людей). Иными словами, компьютеры обычно работают в двоичной системе счисления, поскольку при этом устройства для их обработки получаются значительно более простыми. Ввод чисел в компьютер и вывод их для чтения человеком может осуществляться в привычной десятичной форме, а все необходимые преобразования выполняют программы, работающие на компьютере.

 

 

 

1. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ

ФОРМАТЫ ДАННЫХ: ПРЕДСТАВЛЕНИЕ  И КОДИРОВАНИЕ 

ИНФОРМАЦИИ В КОМПЬЮТЕРЕ

 

1.1. Компьютерное кодирование чисел

 

Существуют два основных формата представления чисел в памяти компьютера. Один из них используется для кодирования целых чисел, второй (так называемое представление числа в формате с плавающей точкой) используется для задания некоторого подмножества действительных чисел.

Множество целых чисел, представимых в памяти ЭВМ, ограничено. Диапазон значений зависит от размера области памяти, используемой для размещения чисел. В k-разрядной ячейке может храниться 2k различных значений целых чисел.

Чтобы получить внутреннее представление целого положительного числа N, хранящегося в k-разрядном машинном слове, необходимо:

1) перевести число  N в двоичную систему счисления;

2) полученный результат  дополнить слева незначащими  нулями до k разрядов.

Например, получим внутреннее представление целого числа 1607 в 2-х байтовой ячейке. Переведем число в двоичную систему: 160710 = 110010001112. Внутреннее представление этого числа в ячейке будет следующим: 0000 0110 0100 0111.

Для записи внутреннего  представления целого отрицательного числа (-N) необходимо:

1) получить внутреннее  представление положительного числа  N;

2) обратный код этого  числа заменой 0 на 1 и 1 на 0;

3) полученному числу  прибавить 1.

Например, получим внутреннее представление целого отрицательного числа -1607. Воспользуемся результатом предыдущего примера и запишем внутреннее представление положительного числа 1607: 0000 0110 0100 0111. Инвертированием получим обратный код: 1111 1001 1011 1000. Добавим единицу: 1111 1001 1011 1001 - это и есть внутреннее двоичное представление числа -1607.

Формат с плавающей  точкой использует представление вещественного числа R в виде произведения мантиссы m на основание системы счисления n в некоторой целой степени p, которую называют порядком: R = m × np.

Представление числа  в форме с плавающей точкой неоднозначно. Например, справедливы следующие равенства:

12.345 = 0.0012345 × 104 = 1234.5 × 10-2 = 0.12345 × 102.

Чаще всего в ЭВМ  используют нормализованное представление числа в форме с плавающей точкой. Мантисса в таком представлении должна удовлетворять условию: 0.1p <= m < 1p. Иначе говоря, мантисса меньше 1 и первая значащая цифра не ноль (p - основание системы счисления).

В памяти компьютера мантисса представляется как целое число, содержащее только значащие цифры (0 целых и запятая не хранятся), так для числа 12.345 в ячейке памяти, отведенной для хранения мантиссы, будет сохранено число 12345. Для однозначного восстановления исходного числа остается сохранить только его порядок, в данном примере - это 2.

Двоичная система счисления (двоичный код) - код, в котором для представления информации используются цепочки бит. Для представления целых чисел используются:

  • прямой код - знак кодируется нулем для положительных и единицей для отрицательных. 510= 0 000101; -510= 1 000101
  • обратный код (или дополнительный - дополненный до единицы) для положительных чисел совпадает с прямым кодом, а для отрицательных получается из соответствующего прямого путем поразрядного обращения каждого бита кроме знакового: -5=1 111010

Данный код позволяет  унифицировать сложение и вычитание с оговоркой, что если при суммировании чисел в обратном коде длина результата превысит стандартную длину цепочки, то происходит циклический перенос старшего разряда в младший.

Для умножения и деления  обратный код менее удобен, чем  прямой. В основном обратный код нужен для получения дополнительного.

Дополнительный код (или  дополнение до двух) для положительных  чисел совпадает с прямым, а для отрицательных чисел получается из обратного кода сложением с 1. Преимущества дополнительного кода перед обратным кодом является упрощение суммирования, т.к. не возникает необходимости в циклическом переносе из старшего разряда в младший.

 

1.2. Компьютерное кодирование текста

 

Множество символов, используемых при записи текста, называется алфавитом. Количество символов в алфавите называется его мощностью.

Для представления текстовой информации в компьютере чаще всего используется алфавит мощностью 256 символов. Один символ из такого алфавита несет 8 бит информации, т. к. 28 = 256. Но 8 бит составляют один байт, следовательно, двоичный код каждого символа занимает 1 байт памяти ЭВМ. Все символы такого алфавита пронумерованы от 0 до 255, а каждому номеру соответствует 8-разрядный двоичный код от 00000000 до 11111111. Этот код является порядковым номером символа в двоичной системе счисления.

Для разных типов ЭВМ и операционных систем используются различные таблицы кодировки, отличающиеся порядком размещения символов алфавита в кодовой таблице. Международным стандартом на персональных компьютерах является таблица кодировки ASCII.

Принцип последовательного кодирования  алфавита заключается в том, что в кодовой таблице ASCII латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений.

Стандартными в этой таблице являются только первые 128 символов, т. е. символы с номерами от нуля (двоичный код 00000000) до 127 (01111111). Сюда входят буквы латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы. Остальные 128 кодов, начиная со 128 (двоичный код 10000000) и кончая 255 (11111111), используются для кодировки букв национальных алфавитов, символов псевдографики и научных символов.

Сейчас существует несколько различных  кодовых таблиц для русских букв (КОИ-8, СР-1251, СР-866, Mac, ISO), причем тексты, созданные в одной кодировке, могут неправильно отображаться в другой. Решается такая проблема с помощью специальных программ перевода текста из одной кодировки в другую. В операционной системе Windows пришлось передвинуть русские буквы в таблице на место псевдографики, и получили кодировку Windows 1251 (Win-1251).

В течение долгого времени понятия  «байт» и «символ» были почти синонимами. Однако, в конце концов, стало ясно, что 256 различных символов - это не так много. Математикам требуется использовать в формулах специальные математические знаки, переводчикам необходимо создавать тексты, где могут встретиться символы из различных алфавитов, экономистам необходимы символы валют ($, £, ¥). Для решения этой проблемы была разработана универсальная система кодирования текстовой информации - Unicode. В этой кодировке для каждого символа отводится не один, а два байта, т.е. шестнадцать бит. Таким образом, доступно 65536 (216) различных кодов. Этого хватит на латинский алфавит, кириллицу, иврит, африканские и азиатские языки, различные специализированные символы: математические, экономические, технические и многое другое. Главный недостаток Unicode состоит в том, что все тексты в этой кодировке становятся в два раза длиннее. В настоящее время стандарты ASCII и Unicode мирно сосуществуют.

 

 

1.3. Компьютерное кодирование графики

 

Почти все создаваемые, обрабатываемые или просматриваемые с помощью компьютера изображения можно разделить на две большие части - растровую и векторную графику.

Для представления графической  информации растровым способом используется так называемый точечный подход. На первом этапе вертикальными и горизонтальными линиями делят изображение. Чем больше при этом получилось элементов (пикселей), тем точнее будет передана информация об изображении.

Как известно из физики, любой цвет может быть представлен в виде суммы различной яркости красного, зеленого и синего цветов. Поэтому надо закодировать информацию о яркости каждого из трех цветов для отображения каждого пикселя. В видеопамяти находится двоичная информация об изображении, выводимом на экран.

Таким образом, растровые изображения представляют собой однослойную сетку точек, называемых пикселями (pixel, от англ. picture element), а код пикселя содержит информацию о его цвете.

Для черно-белого изображения (без  полутонов) пиксель может принимать только два значения: белый и черный (светится - не светится), а для его кодирования достаточно одного бита памяти: 1 - белый, 0 - черный.

Пиксель на цветном дисплее может  иметь различную окраску, поэтому одного бита на пиксель недостаточно. Для кодирования 4-цветного изображения требуются два бита на пиксель, поскольку два бита могут принимать 4 различных состояния. Может использоваться, например, такой вариант кодировки цветов: 00 - черный, 10 - зеленый, 01 - красный, 11 - коричневый.

На RGB-мониторах все разнообразие цветов получается сочетанием базовых цветов: красного (Red), зеленого (Green), синего (Blue), из которых можно получить 8 основных комбинаций (Таблица 1):

 

Основные комбинации цвета

Таблица 1

Цвет

R

G

B

Черный

0

0

0

Синий

0

0

1

Зеленый

0

1

0

Голубой

0

1

1

Красный

1

0

0

Пурпурный

1

0

1

Желтый

1

1

0

Белый

1

1

1


 

Качество кодирования  изображения зависит от двух параметров.

Во-первых, качество кодирования изображения тем выше, чем меньше размер точки и соответственно большее количество точек составляет изображение.

Информация о работе Форматы данных: представление и кодирование информации в компьютере