Музыкальный файл размером в 1 килобайт
#1 OFFLINE
Отправлено 17 Июнь 2009 - 01:25
Разработчики новых редакций формата mp3, конечно же, пекутся о качестве звука, вот только объемы данных при этом, как и следовало ожидать, раздуваются. К большому сожалению для них и к большой радости для нас, в будущем может возникнуть формат, позволяющий сохранять данные в объемах порядка 1 килобайта. Этим достижением мы обязаны ученым университета Рочестера, которым удалось в столь малый объем данных уместить музыкальный фрагмент с качеством даже лучше, чем mp3.
Для этого они подвергли компьютерному анализу акустические характеристики звучащего кларнета, а также особенности отдельных приемов игры на нем. Далее компьютерное моделирование позволило создать виртуальные модели кларнета и кларнетиста. И, наконец, осталось ввести в эти модели нотную партитуру и несколько простеньких эффектов в едином файле, подобно тому, как это делается в MIDI-формате. В результате на выходе получилось 20 секундное соло на кларнете, которое занимает в 10 000 раз меньше места, чем соответствующий mp3-файл. В настоящий момент ученые работают над созданием версии формата для нескольких инструментов.
© MobileDevice
#2 OFFLINE
#3 OFFLINE
Отправлено 17 Июнь 2009 - 01:57
#4 OFFLINE
Отправлено 17 Июнь 2009 - 02:36
Viktor@s (17th June 2009 - 02:25) писал:
результаты - известны(ну вы все слышали midi рингтоны на мобилах, как-бы похоже на мелодию, но далеко не музыка). в принципе никаких существенных результатов превосходящих музыкальную шкатулку пока не получено. А сколько ей? 1000? или 5000 лет?
#5 OFFLINE
Отправлено 18 Июнь 2009 - 17:35
#6 OFFLINE
Отправлено 18 Июнь 2009 - 23:11
Если же говорить о цифре, то это не более, чем математика. Никаких "нетривиальных методов игры" тута нету... никто там "вживую" не играет. Цифровой звук только похож на оригинал, но на самом деле в мире нет ни одного цифрового формата, который бы отражал аналоговую гармонику в полном объёме. Даже небольшой звуковой аналоговый фрагмент можно теоретически "оцифровывать" до бесконечности!
В статье речь шла о оригинальной методике построения звукового сигнала, а не о том, что вы там себе сфантазировали. Многие архиваторы, для осуществления сжатия, формируют так называемые библиотеки, описывающие структурированность сжимаемого файла - тут примерно тоже самое. Сравнение с MIDI не совсем корректное т.к. MIDI устройство - это синтезатор (секвенсор), который фактически является автоматическим музыкальным инструментом, а описываемая методика относится к формату СЖАТИЯ, где при "разворачивании" нужна специальная библиотека, а не банальное синтезирование в понимании формата MIDI.
А вот такие цифровые форматы, как mp3 используют другой метод - они просто строят волну по шкале с определённым шагом... выражается это в килогерцах на битрейд. Как тут можно приплетать что-то подобное, если ЭТО вообще из другой оперы?
#7 OFFLINE
Отправлено 19 Июнь 2009 - 00:11
#8 OFFLINE
Отправлено 19 Июнь 2009 - 00:21
#9 OFFLINE
Отправлено 19 Июнь 2009 - 02:57
ufos_3rd_try (Jun 19 2009, 01:11) писал:
Одно дело: слышать (пусть даже и в плохой оцифровке) как ЖИВОЙ трубач берёт чуть фальшивую ноту (и слышать его живое дыхание), или скажем гранж-гитарист "вешает" "грязный" аккорд, при том что пара струн у него вообще не настроены.. а уж про ЖИВОЙ голос и не говорю..
И другое дело - когда это заменяется супер-пупер-синтезатором...
Этак мы скоро дойдём до робото-подобного состояния... (немного фантазии) По радио передают: "...а сейчас по вашей заявке звучит ода "К радости", далее цифровой шум, наше личное супер-пупер-цифровое устройство (м.б. встроенное в мозг) принимает кодовую комбинацию и начинает синтезировать фрагмент № 00018354, импульсы передаются прямо в нервные волокна.. Жуть!!!
#10 OFFLINE
Отправлено 19 Июнь 2009 - 03:28
NeByvalyi (18th June 2009 - 19:57) писал:
#11 OFFLINE
Отправлено 19 Июнь 2009 - 13:03
NeByvalyi (Jun 19 2009, 01:57) писал:
Одно дело: слышать (пусть даже и в плохой оцифровке) как ЖИВОЙ трубач берёт чуть фальшивую ноту (и слышать его живое дыхание), или скажем гранж-гитарист "вешает" "грязный" аккорд, при том что пара струн у него вообще не настроены.. а уж про ЖИВОЙ голос и не говорю..
И другое дело - когда это заменяется супер-пупер-синтезатором...
:)
Вам же ясно написали:
"удалось в столь малый объем данных уместить музыкальный фрагмент с качеством даже лучше, чем mp3"
Это значит, что все шорохи, фальшь, кудахтанья, улюлюканья и прочее - осталось на месте! Причём даже лучше, чем в вашем любимом mp3. Просто способ, как это сделано другой. ЭТО НЕ MIDI И НЕ СИНТЕЗАТОР! Не понимаете чего-нибудь, так и не мутите воду зря. ;)
Вспомните про звук в мобильнике. Там голос настолько искажается, что вообще не похож на человеческий, но вы узнаёте в нём свою родню и не гундите, что мол "понасинтезировали тут"... поэтому я ещё раз повторяю - цифровой формат только напоминает живой звук, в той или иной степени, но не может 100% воссоздать его! А синтезаторы ничего не пытаются даже напоминать - они просто звучат своим голосом и всё.
#12 OFFLINE
Отправлено 20 Июнь 2009 - 03:33
luha (19th June 2009 - 14:03) писал:
"удалось в столь малый объем данных уместить музыкальный фрагмент с качеством даже лучше, чем mp3"
есть такая штука - теория информации, и её как-бы ещё не опровергли.
суперархиваторов не бывает(с возможностью разжатия). хотя об этом много говорят и много пишут.
существуют вполне конкретные пределы сжатия любой информации
хоть музыки, хоть видео. переплюнуть энтропийный предел - просто глупо, что-то вроде создания вечного двигателя...
конечно можно "сжать" музыку, но это "сжатие" - не сжатие вовсе, а всего-лишь вычисление, как алгоритм вычисления числа Pi, которое бесконечно.
#13 OFFLINE
Отправлено 20 Июнь 2009 - 03:45
luha (19th June 2009 - 14:03) писал:
разница имеется - это те-же самые колебания воздуха, обращённые в цифры. конечно они сильно искажённые, но те-же самые. можешь сам почитать спецификацию GSM. Ты заблуждаешься, думая что звук синтезируют. Это - не так. Синтезирую только рингтоны, да и то, только midi... в последние годы даже рингтоны стали не синтезированные(mp3шные).
конечно, это сообщение будет намного короче как сообщение(как текст), чем я его вслух прочитаю, и вам пошлю как прикреплённый mp3 файл, да только его не синтезировать, нет таких программ, вы сами можете послушать ЧТО есть... в виндовс это встроено...
#14 OFFLINE
Отправлено 20 Июнь 2009 - 12:57
Цитата
хоть музыки, хоть видео. переплюнуть энтропийный предел - просто глупо ...
Цитата
P.S.
Мне было что сказать, и тема мне понравилась. Я не горячий спорщик и отношусь к этому всему с юмором. Спасибо всем, было очень весело!
#15 OFFLINE
Отправлено 20 Июнь 2009 - 13:41
luha (20th June 2009 - 13:57) писал:
предел имеет ВСЁ... в том числе и сжатие. Этот предел как раз и называется энтропией... http://ru.wikipedia....
понятие не я придумал, ему уже лет сто скоро будет...
Цитата
1. Некоторые биты данных могут не нести информации. Например, структуры данных часто хранят избыточную информацию, или имеют идентичные секции независимо от информации в структуре данных.
2. Количество энтропии не всегда выражается целым числом бит.
luha (20th June 2009 - 13:57) писал:
P.S.
Мне было что сказать, и тема мне понравилась. Я не горячий спорщик и отношусь к этому всему с юмором. Спасибо всем, было очень весело!
#16 OFFLINE
Отправлено 20 Июнь 2009 - 15:49
Если сжимать с умышленной потерей данных, как например это делается в формате JPG, то можно добиться значительных сокращений объёма файла, но при этом часть информации теряется БЕЗВОЗВРАТНО! При таком положении дел приведённая тобой выше концепция "энтропии" ВООБЩЕ НЕ ПРИ ЧЁМ т.к. мы сокращаем объём, выбрасывая информацию и не пытаемся ничего сжимать. Если сжать текст методом, применяемым в JPG или mp3, то он будет напоминать школьное сочинение на тему "Война и мир"... с той разницей, что оригинал значительно объёмнее! Надеюсь я понятно выражаюсь ;)
А если мы рассматриваем АЛЬТЕРНАТИВНЫЕ способы описания информации, на подобие того, о чём пишут в статье данной темы, то картина выглядит вообще по новому! Никакая "энтропия" к этому тоже не имеет совершенно никакого отношения т.к. если рассматривать опять же на примере графических форматов,
то:
GIF - сжимает без потерь с ограничениями "энтропии"
JPG - сжимает с потерями и не имеет отношения к "энтропии"
CDR - описывает без потерь и не имеет отношения к "энтропии"
Обратите внимание, что векторный формат "CDR" (Corel) не сжимает файл, а только описывает его! За счёт этого свойства информация не имеет потерь, а сам файл занимает считанные килобайты. Это просто такой способ описания информации. Именно это и предлагают авторы нового формата. Нету там речи о синтезировании или о сжатии с потерей качества, или о "энтропии" и о том, что такое в принципе не возможно и статья была взята из раздела "сказки", а мы в сказки верить не будем.
Нужно чётко понимать, что на одном только mp3 и JPG свет клином не сошёлся и в мире существуют другие способы достичь нужного результата. Правда, судя по всему, не все способны усвоить такую сложную мысль!
P.S. Хорошо, что хоть я усваиваю (мысли в слух)
#17 OFFLINE
Отправлено 20 Июнь 2009 - 23:57
luha (20th June 2009 - 16:49) писал:
luha (20th June 2009 - 16:49) писал:
- предварительная обработка: на этом этапе информация не сжимается, а обычно наоборот - увеличивается в объёме. этот этап нужен для раскрытия внутренних зависимостей. например в LZ77(zip) текст делится на "слова", и записывается не слова, а то, когда эти слова появлялись в последний раз. Для текста это имеет смысл, т.к. слов в тексте немного(в бешеные тыщи биллионов раз), чем комбинаций букв того-же размера. А вот картинки(в том-же JPEG) делятся на квадратики, например 64х64, т.к. внутри такого квадратика цвета и точки очень похожи. Здесь-же и выкидывается плохо видимая(слышимая) информация(если сжатие с потерями).
- энтропийное кодирование.
вот ту-то и происходит сжатие. смысл(и алгоритм) очень простой: те символы которые часто встречаются записываются меньшим количеством битов. Т.о. в один байт можно вместить много символов.
luha (20th June 2009 - 16:49) писал:
JPG - сжимает с потерями и не имеет отношения к "энтропии"
CDR - описывает без потерь и не имеет отношения к "энтропии"
luha (20th June 2009 - 16:49) писал:
luha (20th June 2009 - 16:49) писал:
JPEG имеет непосредственное отношение к энтропийному кодеку(арифметическому). Как раз и сжимается информация именно арифметиком. Впрочем как и в GIF. А вот bzip2 использует метод Хаффмана. Это тоже энтропийный кодек, хотя несколько более худший(по сжатию). За то Хаффман Свободный, в отличие от арифметика.
#18 OFFLINE
Отправлено 21 Июнь 2009 - 00:19
luha (20th June 2009 - 16:49) писал:
Никакой формат и алгоритм сжатия без понятия энтропии немыслим. Это фундаментальное понятие.
Сжатие - есть процедура понижения энтропии(наведения порядка), было 8 бит на символ, стало 1.567 - файл стал короче. Ты понимаешь "энтропию" чисто интуитивно, но это вовсе не мешает ей существовать вполне себе даже объективно. И делать невозможным всякие "супер-архиваторы", вроде того, что в первом посте. Сжать файл на столько просто невозможно - слишком много надо выкинуть. Из музыки получится рингтон от Simens 2000го года(помнишь такие аппараты?)
#19 OFFLINE
Отправлено 21 Июнь 2009 - 02:04
Ну и в дебри мы забрались...
Ладно. Давай разбираться по порядку. Я этот новый формат не разрабатывал, ты тоже его не разрабатывал, поэтому мы оба можем лишь предполагать что там у них на уме. Для большей справедливости давай вообще отложим конкретный формат, о котором шла речь в самом начале, а поговорим о способах представления данных и сжатии вообще!
Первое, что я хотел бы выяснить - есть сжатая информация, а есть и не сжатая! :D
Второе, что я хочу определить - я не совсем имел в виду сжатие, или синтезирование или ещё что-то там. Я говорю о СПОСОБЕ ОПИСАНИЯ!
Предположим, что ты берёшь девять чисел из ста и тебе нужно представить их более простым способом. Представлять будем не в двоичной, а в десятичной системе, для наглядности. Наугад выберу числа: 24, 30, 46, 52, 55, 69, 73, 88 и 91 ... всего девять. Если мы их запишем в ряд, то у нас получиться "243046525569738891". Ну, поскольку мы немного знаем математику, то для более краткого представления этих чисел мы приводим их к более простым условным значениям... присваиваем им более короткие однознаковые значения, уславливаясь, что одно представляет другое:
1=24
2=30
3=46
4=52
5=55
6=69
7=73
8=88
9=91
Теперь, записав новые значения в строку мы получаем "123456789", что в два раза короче, чем "243046525569738891"! Всегда можно свериться с таблицей представления и восстановить исходные цифры.
Именно по такому принципу и работают архиваторы. Не буду вдаваться в некоторые дополнительные математические способы более простого представления числа и прошу не упрекать меня в том, что я их не описываю... благо никому это тут не нужно. ;)
Тем не менее суть именно сжатия такова и тут уже можно говорить о энтропии т.к. есть математический предел возможности упрощения представления данных, преодолеть который в теории нельзя (вспоминай своё же сравнение с вечным двигателем).
А теперь я постараюсь объяснить свою точку зрения:
Самое смешное - в моём понимании выражения "СПОСОБ ОПИСАНИЯ" нет намёка на сжатие информации! Всё, что я привёл про архивирование выше (в этом посте) никакого отношения не имеет к описательному формату, а, значит, до какого-либо архивирования или энтропии банально не дошло дело...
Мы берём НЕ ЦИФРОВОЕ ЧТО-ТО и начинаем его описывать. Пусть это будет рукописный текст на листе бумаги. Мы можем поделить площадь изображения на квадратики чёрного и белого цветов и записать их ноликами и единичками в один большой и толстый файл... а можем вычислить векторы движения пера и довольно изящно записать их в более компактном виде. Мы ЕЩЁ НЕ ПРИСТУПИЛИ ни к какому сжатию информации, а уже имеем два очень отличающихся по методике и по размеру формата.
Ну, люди, постарайтесь представить себе, что векторный формат не оттого имеет маленький размер и высокое качество, что его очень сильно запаковали...... он просто более хитро задуман изначально!
А вот теперь можно приступать к запаковке, архивированию и энтропированию, ведь мы уже имеем последовательность цифр, которые поддаются математическому анализу. Поэтому я и говорил и говорю и буду говорить, что НИКАКОГО ОТНОШЕНИЯ НЕ ИМЕЕТ ЭНТРОПИЯ К ОПИСАТЕЛЬНОМУ ФОРМАТУ. Как может иметь она отношения, если мы ещё ничего не архивировали и где я тут жестоко ошибаюсь?!
Очень надеюсь, что сумел ясно выразить свои мысли. Думаю, подлинная проблема в том, что имея такие форматы для графики и не имея их для звука мы начинаем думать, что они не возможны в принципе и на этом зацикливаемся.
:)
Сообщение отредактировал luha: 21 Июнь 2009 - 02:09
#20 OFFLINE
Отправлено 21 Июнь 2009 - 02:31
luha (21st June 2009 - 03:04) писал:
проблема в том, что твоя таблица больше файла...
luha (21st June 2009 - 03:04) писал:
luha (21st June 2009 - 03:04) писал:
давай вернёмся к форматам, и тогда я тебе покажу КАК и ГДЕ вылезет эта поганая "энтропия", которая всё испортит.
Количество пользователей, читающих эту тему: 0
0 пользователей, 0 гостей, 0 анонимных