Анализ функционала сервиса «Речевого блокнота» и сравнение с решением конкурентов

Автор работы: Пользователь скрыл имя, 19 Июня 2014 в 15:02, курсовая работа

Краткое описание

Такая инновация поможет любому пользователю частично управлять своим браузером. При помощи голосовых команд можно будет заполнять формы регистрации, и осуществлять написание текстов, а также можно будет осуществлять голосовой поиск. В частности, если вам нужно, например, найти услуги грузчиков в Москве, вы просто заходите в поисковик и произносите эту фразу. Как сообщают представители Google Chrome, в дальнейшем голосовое пользование перейдет на новый уровень, вплоть до того, что использование клавиатуры при пользовании этого браузера вообще не понадобится. В будущих версиях Google Chrome планируется расширить модуль распознавания голоса, благодаря которому расширится функция голосового управления веб-браузером.

Вложенные файлы: 1 файл

Диплом.docx

— 388.61 Кб (Скачать файл)

Введение

  Распознавания речи в последнее время стала очень популярной. Эта функция стала появляться в различных приложениях, которые используют интернет-браузеры. Корпорация Google первой приобрела и установила такую функцию на своем Chrome 11.

Такая инновация поможет любому пользователю частично управлять своим браузером. При помощи голосовых команд можно будет заполнять формы регистрации, и осуществлять написание текстов, а также можно будет осуществлять голосовой поиск. В частности, если вам нужно, например, найти услуги грузчиков в Москве, вы просто заходите в поисковик и произносите эту фразу. Как сообщают представители Google Chrome, в дальнейшем голосовое пользование перейдет на новый уровень, вплоть до того, что использование клавиатуры при пользовании этого браузера вообще не понадобится. В будущих версиях Google Chrome планируется расширить модуль распознавания голоса, благодаря которому расширится функция голосового управления веб-браузером.

Несмотря на то, что одним из наиболее перспективных направлений для внедрений систем распознавания речи может стать сфера компьютерных игр, узкоспециализированных реабилитационных программ для инвалидов, телефонных и информационных систем, ведущие разработчики речевого распознавания наращивают усилия по достижению универсализации и увеличения объемов словаря даже в ущерб сокращению процедуры предварительной настройки на диктора.

Будущее речевого интерфейса не в меньшей степени зависит от умения современных исследователей и разработчиков не только создать технологическую основу речевого ввода, но и гармонично слить технологические находки в единую логически завершенную систему взаимодействия «человек-компьютер».[1]

 

 

 

 

  1. Анализ функционала сервиса «Речевого блокнота» и сравнение с решением конкурентов .

Одна из последних разработок в области распознавания речи является блокнот для речевого ввода:  SpeechPad .ru  созданный на базе Web.speech.API, корпорация Google .

 Cпецификация Web.speech.API  определяет JavaScript API, чтобы позволить веб-разработчикам включить распознавание и синтез речи в свои веб-страницы. Это позволяет разработчикам использовать для создания сценариев текста в речь и выход использовать распознавание речи в качестве входа для формы, непрерывная диктовка и контроля. JavaScript API позволяет веб-страниц для управления активацией и времени и для обработки результатов и альтернатив.

API веб речи направлена ​​на создание возможностей веб-разработчиков, обеспечением  в веб-браузере, речевого ввода и преобразования текста в речь выходных функций, которые, как правило, недоступны при использовании стандартного распознавания речи или программами чтения с экрана API.[3]

                                       Модуль распознавания речи Chrome.

 

 


                         

  Сайт Speechpad.ru - это бесплатный сервис для речевого ввода текстовой информации. Пользователь говорит в микрофон, а Speechpad распознает речь и конвертирует ее в текст, который можно сохранить в текстовом файле. Другими словами, этот сайт предоставляет вам бесплатные услуги стенографиста.

Польза такого сервиса очевидна - скорость ввода текста "с голоса" в несколько раз выше по сравнению с вводом с клавиатуры. При этом все, что надо иметь пользователю - это более-менее качественные микрофон и звуковую плату (желательно - со встроенным фильтром шумов).

  Данный голосовой блокнот имеет функцию «Транскрибация», которая позволяет переводить

аудио- и видеофайлы в текст. Видео можно брать из интернета, копируя в блокнот лишь его  URL-адрес либо его ID.

В голосовой блокнот добавлена  возможность по подаче команд голосом. При отмеченном флажке «Выполнять команды» во время непрерывной диктовки можно подавать команды. В настоящее время распознаются следующие двухсловные команды: «команда отменить» , «команда сбросить» и«команда копировать» . Два слова «Команда отменить», произнесенные во время диктовки, осуществляют сброс текста, который был направлен последним в результирующее поле. После чего непрерывная запись перезапускается. Два слова «Команда сбросить» – сбрасывают надиктованный, но еще не попавший в результирующее поле текст. После чего непрерывная запись также перезапускается. «Команда копировать»- произнесенное сочетание копирует текст из результирующего поля в буфер обмена и останавливает ввод. Копирование возможно только при наличие расширения для голосового блокнота.

  Расширение для голосового блокнота  позволяет вводить текст напрямую в текстовые поля. 

Вышла версия 4.0 расширения. В ней усилены возможности ввода в текстовые поля на сайтах.

Расширение работает только в браузере Chrome. После установки расширения можно будет нажимать правой кнопкой в любом поле ввода и выбирать пункт 
Speechpad–>Start voice input. 
После чего произносимый в микрофон текст будет напрямую поступать в поле ввода. 
Ещё одной отличительной особенностью голосового блокнота «Speechpad», является то, что он оснащён кабинетом пользователя, который значительно расширяет его функционал. В кабинете пользователя можно:

- создавать удобный для Вас вид блокнота (обычный/компактный),

- вставлять или убирать  кнопки для редактирования текста,

- вводить, сохранять, редактировать, удалять слова для замены слов  в тексте,

-сохранять, просматривать, редактировать тексты.

Speechpad-очень прост и удобен в использовании. Приведённый выше расширенный спектр функций значительно отличает данный голосовой блокнот от подобных.

Ниже приведена таблица сравнения функционала с аналогами  Speechpad.

Для сравнения функций я взяла некоторые показатели, важные, на мой взгляд, других сервисов

и сравнила их в единичной системе:

Показатели:

  1. Работа с аудио/видео файлами- возможность перевода аудио/видео файлов в текстовые форматы, для дальнейшей работы.
  2. Наличие кабинета пользователя- необходим для создания своего аккаунта, а так же дальнейшей работы с профилем, различными приложениями и разделами состовляющие этот кабинет.
  3. Работа в онлайн режиме- для возможности оперативно брать из интернета нужную вам

информацию.

  1. Наличие текстового редактора-возможность грамотной корректировки текста в самом блокноте.
  2. Простота и доступность в использовании. Наличие бесплатной версии, незамысловатый интерфейс, простота авторизации/регистрации.

 

                             Показатели

 

Наименование

Распознаваниеаудио/видео

файлов

Наличие кабинета пользователя

Работа  в

он-лайн режиме

Наличие текстового редактора

Простота и доступность в использовании

ИТОГИ

Speechpad

(Speecpad.ru)

1

1

1

0

1

4

Голосовой набор текста

(problem-net.net)

0

0

1

0

1

2

Голосовой блокнот

(Shops.jobsbuks.com)

0

0

1

1

1

3

Наборщик v1.0 
(http://s419.ru/naborshhik/)

0

0

1

0

1

2

Еvernote- записная книжка

1

1

0

1

0

1

ORGANIZET.ru

записная книжка

0

1

1

1

0

3



 

http://appstudio.org/notes/

Рис. 2 Таблица сравнения

Подведя итоги таблицы, видно, что голосовой блокнот Speechpad  по своим функциям опережает конкурентов.

 

 

 

 

 

 

.

 

 

2. Постановка задачи.

Цель: Разработка кабинета пользователя для сервиса  голосового блокнота «SpeechPad».

Задачи:

  1. Создание модуля работы с пользовательскими терминами.
  2. Создание модуля сохранения и загрузки текстов.
  3. Создание модуля  настройки интерфейса.

Создание модуля профиля пользователя. 
3. Выбор программного обеспечения

Для реализации программного продукта был выбран язык PHP. Это язык обработки гипертекста (HTML), используемый на стороне сервера (server side scripting language), конструкции которого вставляются в HTML-текст. В 2003 году вышла версия PHP 5.0 на базе машины Zend Engine 2 (фирма Zend Technologies Ltd), дает возможности для создания полномасштабных приложений, начиная с пятой версии его можно называть объектно-ориентированным. PHP является открытым программным продуктом, что означает его бесплатность и возможность создавать свои собственные расширения языка. PHP является самым молодым, перспективным и быстроразвивающимся из языков программирования для интернет-приложений, доля его использования по сравнению с другими языками быстро растет.

Его основные преимущества:

- широкая поддержка различных  технологий;

- совместимость с серверами;

- базами данных;

-  простота и бесплатность;

Для более быстрой и качественной разработки был выбран framework для php Codeigniter.

Codeigniter обладает следующими преимуществами:

- Поддержка версий php 4, 5;

- Модель MVC (Model-View-Controller);

- Легко расширяемая система через подключение собственных библиотек и плагинов;

- Фреймворк уже содержит в себе большинство необходимых библиотек для работы с файлами, отправки электронных писем, проверкой данных форм, поддержки сессий, работу с изображениями и многие другие;

- Хорошо спроектированная документация на английском языке с примерами;

- Очень быстрый в работе (не нагружает страницу);

Этот движок основан на модели Model-View-Controller (Модель-Вид-Контроллер).

Это шаблон проектирования, в котором модель данных приложения, пользовательский интерфейс и управляющая логика разделены на три отдельных компонента так, что модификация одного из компонентов оказывает минимальное воздействие на остальные.

Стандартная схема архитектуры «Модель-Вид-Контроллер» изображена на следующем рисунке:

 

Рис. 3. Модель MVC

Представление (вид) отвечает за отображение информации, поступающей из системы или в систему.

Модель является «сутью» системы и отвечает за непосредственные алгоритмы, расчёты и тому подобное внутреннее устройство системы.

Контроллер является связующим звеном между «представлением» и «моделью» системы, посредством которого и существует возможность произвести разделение между ними. Контроллер получает данные от пользователя и передаёт их в «модель». Кроме того, он получает сообщения от модели, и передаёт их в «представление».

Применительно к интернет-приложениям существует мнение, что части контроллер и представление объединены, потому что за отображение и одновременно за ввод информации отвечает браузер. С этим можно согласиться, а можно не соглашаться и выделить-таки контроллер в отдельную часть.

 

Представление. Модуль вывода информации. Это может быть шаблонизатор или что-либо подобное, цель которого является только в выводе информации в виде HTML на основе каких-либо готовых данных.

Контроллер. Модуль управления вводом и выводом данных. Данный модуль должен следить за переданными в систему данными (через форму, строку запроса, cookie или любым другим способом) и на основе введённых данных решить:

· Передавать ли их в модель

· Вывести сообщение об ошибке и запросить повторный ввод (заставить модуль представление обновить страницу с учётом изменившихся условий)

Кроме того, контроллер обязан определять тип данных, полученных от модели (есть ли это готовый результат, отсутствие оного, либо сообщение об ошибке) и передавать информацию в модуль представления.

Модель. Модуль, отвечающий за непосредственный расчёт чего-либо на основе полученных от пользователя данных. Результат, полученный этим модулем, должен быть передан в контроллер, и не должен содержать ничего, относящегося к непосредственному выводу (то есть должен быть представлен во внутреннем формате приложения).

Для исполнения приложений клиента на большинстве хостинг-площадок провайдеры предоставляют небольшое количество ресурсов (как вычислительных, так и дисковых). Поэтому для данного применения была необходима высокоэффективная СУБД, обладающая при этом высокой надежностью. Поэтому была выбрана MySQL, так как она является наиболее приспособленной в среде web.

Основными преимуществами данной СУБД являются:

- Гибкая система привилегий и паролей;

- Интерфейс с языками C и Perl, PHP;

- Быстрая работа, масштабируемость;

- Совместимость с SQL;

- Хорошая поддержка со стороны провайдеров услуг хостинга;

При разработке интерфейса важной задачей являлось реализовать его как можно более понятным и простым для пользователя, но при этом не теряющим свою функциональность. Поэтому, применялись средства javascript(объектно-ориентированный скриптовый язык программирования) и ajax(подход к построению интерактивных пользовательских интерфейсов веб-приложений, заключающийся в «фоновом» обмене данными браузера с веб-сервером). А для того, чтобы сократить время на разработку, была использована javascript-библиотека JQuery и ее дополнение JqueryUI. Библиотека jQuery помогает легко получать доступ к любому элементу DOM-дерева, обращаться к атрибутам и содержимому элементов DOM, манипулировать ими. Также библиотека jQuery предоставляет удобный API по работе с Ajax и имеет большой ассортимент готовых плагинов под самые различные задачи. [2]

Информация о работе Анализ функционала сервиса «Речевого блокнота» и сравнение с решением конкурентов