ComUnidade
WirelessBrasil
Grupos
de Discussão:
Série de artigos sobre VoIP:
Artigo 05 - [02/05/06]
Sinalização
Artigo 04 - [23/05/06]
Dimensionamento VoIP (WAN)
Artigo 03 - [18/05/06]
Roteadores e QoS
Artigo 02 -
[11/05/06]
TCP/IP for not-so dummies
Artigo 01 -
[04/05/06]
Voip - Introdução
Artigo - [09/01/06]
Métodos de Codificação de Voz – Uma Introdução
|
Assuntos das
Mensagens
[22/12/04]
Duas mensagens:
1. Vocoders
2. Respondendo perguntas sobre Vocoders
[15/12/04] "Para quem gosta de fazer apologia do GPRS"
[26/11/04] GPRS x EDGE
[21/09/04] Voice over IP e a Identificação de Chamada
[16/04/04] Transmissão Espacial
Duas mensagens:
1. Vocoders
2. Respondendo perguntas sobre Vocoders
----- Original Message -----
From: jose.smolka@vivo.com.br
To: wirelessbr@yahoogrupos.com.br ; Celld-group@yahoogrupos.com.br
Sent: Wednesday, December 22, 2004 5:47 PM
Subject: [Celld-group] VOCODERs
Pegando um "gancho" deixado pelo "tranquilo_DF" naquela famigerada discussão:
(...) um exemplo é o VOCODER que eu vi alguém perguntar sobre "saber" o funcionamento, e no entanto não vi a resposta sobre isso
(...)
Pois é... parodiando Zéca Pagodinho: "você sabe o que é um VOCODER?
Eu não sei, nunca vi, só ouço falar..." :o)
Literalmente, VOCODER é um acrônimo para VOice enCODER - codificador de voz (claro que, para cada tipo de encoder, existe o decoder correspondente, mas ambos os casos recebem a mesma denominação).
VOCODERs pertencem a uma classe de dispositivos de hardware e/ou software cujo objetivo é adaptar as características de um sinal (analógico ou digital) às limitações do meio de transmissão - onde a banda de passagem é limitada, ou às limitações do meio de armazenamento - onde o espaço físico disponível é limitado. Nesta categoria geral entram, também, os MODEMs
(MOdulator/DEModulator) de dados e CODECs (COder/DECoder) de vídeo.
Vamos nos limitar à transmissão digital de um sinal de voz (áudio, analógico).
Existem aspectos matemáticos e psicológicos envolvidos, mas vamos devagar.
As etapas do processo que interessam são:
- digitalização e codificação do sinal original,
- transmissão digital do sinal codificado, e
- recepção, decodificação e "analogização" do sinal no destino.
O primeiro passo do caminho é transformar um sinal transportado por variações de pressão atmosférica (geradas pelas cordas vocais do indivíduo transmissor) em um análogo eletromagnético. Isto é feito pelo microfone,
que cria um sinal elétrico de saída (variação de tensão ou corrente) diretamente proporcional ao sinal acústico de entrada.
O próximo passo é digitalizar o sinal de saída do microfone.
Aqui começam as bruxarias.
A técnica básica, e fácil de entender, é conhecida como PCM (Pulse-Coded
Modulation), e as técnicas mais sofisticadas baseiam-se em
modelos matemáticos do funcionamento da laringe e do ouvido humanos.
Vou comentar apenas o caso básico, porque, sinceramente, até para mim (que gosto de matemática e física) os modelos matemáticos dos modelos mais
sofisticados são impenetráveis à primeira vista.
Anyway... o PCM convencional, tal como aplicado em telefonia, parte de um primeiro princípio, que vem da psicologia da percepção de sons pelos seres humanos: embora o espectro auditivo varie de 0 a 20 KHz, o essencial para compreensão do conteúdo e individualização da voz do transmissor está contido na faixa que vai de 0 a 4 KHz (se o assunto for áudio de alta fidelidade - estilo CD, ou se
você estiver lidando com uma população de pessoas com ouvido absoluto - digamos um clube de afinadores de piano, então as premissas mudam).
Então, pegamos o sinal de saída do microfone e passamos por um filtro passa-baixa com
freqüência de corte em 4 KHz (este filtro é conhecido como anti-aliasing)
Agora vem a parte matemática da coisa. Teorema de Nyquist:
Um sinal limitado em faixa (a passagem pelo filtro garante isso) na freqüência
Wc pode ser integralmente recuperado a partir das amostras do sinal, tomadas com
freqüência de amostragem Ws tal que Ws >= 2 * Wc. Então, como nosso sinal está limitado a 4 KHz, se fizermos a amostragem a uma taxa mínima de 8 Kamostras/s, o trem de amostras (valores discretos do sinal original em cada um dos pontos de amostragem no tempo) contém toda a informação necessária para a recuperação do sinal original no destino.
Agora uma pequena discussão sobre a filtragem:
Fazer anti-aliasing analógico com freqüência de corte muito precisa é um problema, porque bons filtros analógicos custam caro.
A alternativa boa e barata é fazer um filtro digital após a amostragem. Neste caso, o que é feito é fazer o anti-aliasing sem muita precisão, amostrar o sinal de saída do anti-aliasing com frequências bem maiores que a mínima exigida pelo teorema
(digamos 16 Kamostras/s - isto é chamado de oversampling), e depois descartar as amostras em excesso (uma sim, outra não, neste caso, para voltar ao mínimo de 8 Kamostras/s exigidas pelo teorema - este processo é chamado de dizimação). O efeito final é o mesmo de um filtro passa-baixa com
freqüência de corte precisamente em 4 KHz, a um custo aceitável.
Agora o problema é a representação numérica do valor de cada amostra, que é conhecido por quantização.
Cada amostra individual pode assumir, de forma contínua, valores entre 0 (nenhum sinal de entrada) e um valor máximo M.
Vamos dividir o intervalo 0 - M em n sub-intervalos.
Cada amostra é avaliada para identificar em qual dos n sub-intervalos ela se encontra, e, a partir daí o número do intervalo onde a amostra se encaixou (variando de
0 a n-1) passa a representar o valor real da amostra.
Aqui surge um problema para a recepção: se cada amostra é representada apenas pelo número do sub-intervalo onde ela se encaixou na origem, qual valor atribuir a ela
na decodificação?
A aproximação estatisticamente aceitável é o valor médio do sub-intervalo correspondente, o que cria uma probabilidade de imprecisão na recuperação do valor exato da amostra.
Este problema, conhecido como erro de quantização, pode ser minimizado aumentando o número de
sub-intervalos, pois quanto maior for este número, menor a probabilidade de ocorrência de erros e, quando eles ocorrem, a diferença entre o valor
recuperado da amostra e o seu valor original é minimizado.
Agora voltamos aos aspectos psicológicos da percepção de sons.
Para o caso telefonia, chegou-se à conclusão que n=256 produzia um resultado final aceitável (áudio digital de alta fidelidade usa n=65536 - a escolha de potências de 2 para os valores de n não é casual), mas tem de ser levada em conta que a sensibilidade do ouvido humano aos erros de quantização varia logaritmicamente, sendo maior para amplitudes baixas e menor para amplitudes altas.
Então, a largura de cada um dos 256 sub-intervalos não é igual.
Os sub-intervalos correspondentes a amplitudes baixas são menores (para minimizar o erro onde o ouvido é mais sensível), e os
sub-intervalos das amplitudes altas são maiores (porque aqui a percepção dos erros de quantização é menor).
Este ajuste é denominado companding e, conforme o organismo de padronização, pode ser feito com escalas logarítmicas diferentes (no caso de telefonia, a ANSI recomenda uma escala chamada A-law, e a ITU recomenda uma escala chamada
mu-law), que tem de ser usadas de forma consistente entre transmissor e receptor, sob pena de perda
de fidelidade.
Então, se o número que identifica a amostra pode variar entre 0 e 255, isto pode ser representado por um número binário com 8 bits de tamanho.
Finalmente, temos o sinal digitalizado, com uma taxa de bits igual a 8 Kamostras/s * 8 bits/amostra = 64 Kbps. Este valor parece familiar?
É a banda do canal básico para comunicações digitais em todas as operadoras de telefonia do mundo.
Só que, para o caso de telefonia móvel, onde a interface do usuário com o sistema é feita via rádio, fica difícil usar esta taxa de bits toda, porque isto significaria alocar uma faixa de rádio muito grande para cada usuário, e caberiam poucos usuários em cada célula.
O segredo é tentar diminuir a demanda de Kbps por usuário, fazendo uma pós-produção no sinal digital PCM.
Os algoritmos para fazer isso são conhecidos como algoritmos de compressão.
Existem duas categorias de algoritmos de compressão:
- sem perda (lossless), onde os algoritmos de compressão/descompressão permitem recuperação exata do fluxo de bits original; ou
- com perda (lossy), onde existem diferenças entre o fluxo de bits original e o fluxo de bits recuperado na
descompressão.
Algoritmos lossy são admissíveis, desde que a perda ocorra de maneira a não prejudicar a percepção do ouvinte sobre a qualidade do som (metalização, picotes, "efeito pato donald" são
conseqüências comuns de perdas excessivas).
Os algoritmos (lossless ou lossy) podem ser abertos (como os recomendados pelo MPEG da IEA/IEC) ou proprietários (como o
Viterbi Encoding, da Qualcomm).
Com o uso de algoritmos de compressão, pode-se atingir redução do fluxo de bits PCM para 32, 16 e até 8 Kbps, sem perda significativa da qualidade do sinal recuperado.
O próximo passo é modular o sinal comprimido de forma a maximizar a relação sinal/ruído na transmissão. Porquê? Lei de Shannon: a capacidade máxima de transmissão de informação C, em bps, de um canal ruidoso é dada pela
expressão C = W * log2 (S/N), onde W é a banda de passagem (em Hz), e S/N é a relação sinal/ruído.
Como a banda de passagem está definida, para melhorar a capacidade, é necessário aumentar S/N.
Em comunicações digitais, isto significa um compromisso entre o número de estados diferentes que o sinal pode assumir e a quantidade de transições de estado por segundo (baud rate) que o receptor consegue discriminar com sucesso.
Vamos usar como exemplo a versão digital de modulação AM, conhecida como ASK (Amplitude-Shift Keying).
Se associarmos dois níveis de amplitude diferentes da portadora, bem separados entre si, para simbolizar,
respectivamente, os valores binários 0 e 1 (vamos esquecer detalhezinhos sobre como sinalizar quando muda de 0 para 1 e de 1 para 0 - aí entram coisas como NRZ, NRZI, Manchester encoding, etc.), podemos ter um bom S/N,
separando bem os dois níveis, a ponto de ser altamente improvável que o ruído do ambiente provocasse uma interpretação errada do significado do sinal.
Mas esta modulação está limitada a codificar 1 bit do sinal digital em cada transição de estado.
Se utilizarmos 4 níveis diferentes de amplitude, cada transição pode representar 2 bits do sinal digital, mas a S/N diminui, porque agora é mais fácil um erro de interpretação por causa de flutuações aleatórias introduzidas pelo ruído do ambiente.
Podemos melhorar a modulação introduzindo mais uma variável, por exemplo a fase do sinal.
Permitindo que o sinal modulado posa assumir 2 estados facilmente discrimináveis de amplitude, e 2 estados facilmente discrimináveis de fase (digamos, zero e pi radianos), temos 2 * 2 = 4 estados possíveis, com 2 bits do sinal digital codificados em cada transição de estado.
Melhora a capacidade sem sacrificar o S/N.
Este é o modelo básico conhecido como quadratura de amplitude e fase, ou QAM (Quadrature-Amplitude Modulation).
Se você aumentar o número de possibilidades para cada variável, você também aumenta a "constelação" de estados, aumentando o número de bits codificados/transição, até o ponto onde S/N ainda fique aceitável.
Daí vem 8-QAM, 16-QAM, e outras tantas formas mais exóticas, mas todo mundo com o mesmo objetivo básico: codificar o máximo possível de bits/transição mantendo S/N dentro de valores aceitáveis.
Para a recepção, siga o caminho inverso: demodulação para obter o sinal comprimido original, descompressão para obter (talvez com perdas) o sinal digital original, "analogização" para obter uma réplica (com erros de quantização) do sinal elétrico analógico original, e amplificação + alto-falante para reconstituir o sinal acústico analógico original.
Se tudo estiver bem feito, o ouvinte não vai se queixar de que não entende o que está sendo dito, ou que não consegue reconhecer a quem pertence a voz.
Ponha esta "tranqueira" toda junta em um mesmo conjunto de ASICs (Application-Specific Integrated Circuit),
et voilà, temos um VOCODER
[ ]'s
J. R. Smolka
--------------------------------------------------------------------------------
De: jose.smolka@vivo.com.br
Data: Qui Dez 23, 2004 11:40 am
Assunto: Respondendo às perguntas sobre VOCODERs
Por partes:
Para o Evandro (do grupo wirelessbr, para o pessoal do celld-group esta
parte desta msg não tem sentido).
Acho que vc não percebeu meu objetivo. Vou explicar melhor. Não estou
querendo continuar, expandir ou modificar a discussão, para mim pra lá de
esgotada (e, sinceramente, off-topic) do CDMA x GSM.
O Hélio avisou, e cumpriu, que msgs sobre o tema seriam encaminhada para uma
página separada do site, e não seriam mais postadas nos forums (pequeno
preciosismo: já que forum é latim, o plural deveria ser latino também? No
caso, "fora"?).
Pois bem. lá nesta página, uma das últimas msgs era de um membro do
celld-group pedindo, justamente, que a discussão voltasse ao plano técnico e
sugerindo que o assunto dos VOCODERs fosse explicado (apesar de, no
contexto da discussão, o tema tenha sido proposto com segundas intenções).
Portanto, se dei a impressão de estar querendo "tripudiar" no contexto
daquela discussão, me desculpe. Para mim ela é assunto encerrado, it's over,
finito, kaput!!!
Para o Marcelo (do celld-group)
Primeiro detalhe, não é o caso de dizer que o terminal celular é um VOCODER.
Ele é um equipamento eletrônico que, entre outras tantas coisas, tem lá
dentro um VOCODER (ou mais de um, se vc considerar que, em redes 2G,
o tratamento das chamadas de dados é diferente das chamadas de voz).
Não tenho nem condição de "escovar" os bits dos algoritmos, porque não sou
especialista nisso, mas podemos discutir as filosofias básicas adotadas.
Uma primeira escola usa o PCM para fazer a conversão A/D (analógico/digital)
na transmissão e D/A (digital/analógico) na recepção, e depois vai fazer
tratamentos no bit stream PCM para economizar banda. Esta
é a filosofia que eu descrevi na msg anterior. É a mais básica, e a mais
fácil de entender, por isso usei esta como exemplo. Tem várias
possibilidades de tratamento do bit stream PCM, uma delas é supressão de
silêncio (não só os silêncios entre frases, mas as pequenas pausas naturais
entre palavras e fonemas, da cadência normal da fala), e outra é, sabendo a
articulação típica dos fonemas, a duração de determinados sons é previsível,
o que significa que, no bit stream PCM, existirão seqüências previsíveis de
valores de amostra, que podem ser "abreviadas"na transmissão e "expandidas"
na recepção.
Outra escola prefere abordar o sinal analógico de áudio como vc mencionou,
um sinal modulado por um determinado dispositivo, no caso o aparelho fonador
humano (laringe, faringe, e cavidade bucal). Compreendendo quais são as
disposições físicas do aparelho fonador utilizadas na emissão de cada
fonema, podemos codificar estas disposições. Nesta abordagem, o PCM será
utilizado muito mais em termos de áudio de alta fidelidade, e o bit stream
de saída (muito mais de 64 Kbps, neste caso) é analisado para identificar
quais são as disposições do aparelho fonador do emissor associadas àqueles
sons. O que é transmitido (possivelmente com compressões posteriores mais na
linha do algoritmo Lempel-Ziv - o mesmo usado por programas populares de
compressão, como WinZip, Gzip, TAR, etc.) é a informação de como o aparelho
fonador do emissor está variando suas disposições físicas no tempo. Esta
informação, na recepção, vai ser intepretada por um "aparelho fonador
eletrônico", que faz a síntese dos sons associados.
Para o Evandro (celld-group)
Na verdade não sou tão especialista assim, a ponto de ficar tecendo
comparações detalhadas sobre cada uma das tecnologias de codificação de voz
que vc mencionou. Sei que o CELP e o ACELP caem na primeira escola que
mencionei acima, mas não sei detalhes suficientes.
Com tanta gente fazendo "diabruras" no bit stream de áudio, o único
parâmetro confiável para dizer se uma determinada tecnologia funciona ou não
é pedir ao usuário que dê sua opinião sobre ela. O índice MOS (Mean
Opinion Score), como o nome diz, é o resultado de uma pesquisa de opinião de
usuários sobre a qualidade subjetiva do sinal recebido. Se não me engano,
cada usuário é convidado a ouvir alguma coisa (conversação? música?
leitura de texto? tudo isso junto? não sei) e dar opinião sobre a qualidade
do áudio, numa escala de 0 (péssimo) a 5 (ótimo). Para que uma tecnologia
seja considerada boa, tem de ter um escore médio igual ou melhor a 4 neste
tipo de teste.
Para falar dos vários tipos de VOCODER usados na prática em cada caso (CDMA,
GSM, TDMA), vou ter de pesquisar e, quem sabe, publicar outra msg sobre o
assunto depois (dá pra ouvir o Hélio salivando, he he he)
J. R. Smolka
"Para quem gosta de fazer apologia do GPRS"
----- Original Message -----
From: jose.smolka@vivo.com.br
To: wirelessbr@yahoogrupos.com.br
Sent: Wednesday, December 15, 2004 5:15
PM
Subject: Re: [wireless.br] EPrado - Quarta -"Para quem gosta de fazer
apologia do GPRS"
Mensagem 01 - de Eduardo Prado:
PARA QUEM GOSTA DE FAZER APOLOGIA DO GPRS ....
... veja aqui um teste real de velocidade do EDGE e do UMTS (WCDMA) para
serviços de dados sem fio:
EDGE = Mais alta velocidade de download (82 kbps) & Mais alta velocidade de
upload (32 kbps)
UMTS = Mais alta velocidade de download (291 A 320 kbps) & Mais alta
velocidade de upload (54 kbps)
Meu Deus!
Não estamos nem falando da velocidade do GSM/GPRS hein?.
Você apostaria nestas tecnologias para serviços de Wireless Data Services
quando o Mundo todo roga e implora por Banda Larga?. Eu não!!!.
Quer saber mais?. Veja aqui:
Cell phones do broadband
Computerworld
Product Review by Grace Aquino
Mensagem 02 - de Eduardo Maia
Eu acho que antes de simplesmente comparar velocidade, é bom definir o
mercado que vai usar essa tecnologia..
No Brasil, no mercado corporativo, 82kbps de download é mais que suficiente
nas aplicações de força de vendas, POC, telemetria.
Nós (Brasil) não somos o Japão e vai demorar um bom tempo até que as
aplicações (para o mercado corporativo - que é o principal usuário) precisem
dessa velocidade.
E outra, a comparação não deve ser feita EDGE X UMTS e sim EDGE X 1xRTT
EV-DO se tratarmos 2,5G X 2,5G
A 3G de transmissão de dados baseado no GSM é tão rápida quanto.
Desculpe, mas eu tenho que concordar em gênero, número e grau com o Eduardo
Prado neste assunto.
Considere o seguinte: se houvesse oferta de serviços de dados baseados em,
digamos, acesso Wi-Fi com backhaul Wi-Max para integração com as
customer premises, com cobertura similar à das operadoras de telefonia
celular, e as devidas features de segurança (já disponíveis)
configuradas, este precioso cliente corporativo (que todo mundo quer, mas
pouca gente entende) iria se contentar em configurar aplicações que caibam
em 100 Kbps ou menos?
Ainda mais sabendo que os dispositivos de acesso (palmtops, handhelds e
notebooks) são essencialmente os mesmos?
E que muitos deles já vem de fábrica com tudo que é necessário para acessar
o serviço, sem necessidade de adição de nenhum hardware ou software
adicional?
Em minha opinião, que já disse outras vezes, estamos vivendo com as
limitações da camada física (níveis 1 e 2 do modelo OSI) mais complicada do
mundo.
E o mercado está aberto e sedento de novidades.
Vale lembrar D. João VI (provavelmente apócrifo) falando ao filho quando
voltou a Portugal: "filho, põe a coroa sobre tua cabeça, antes que algum
outro aventureiro o faça".
J. R. Smolka
GPRS x EDGE
----- Original Message -----
From: jose.smolka@vivo.com.br
To: Celld-group@yahoogrupos.com.br
Sent: Friday, November 26, 2004 2:55 PM
Subject: Re: [Celld-group] GPRS x EDGE
Uma pergunta simples para
este final de semana .......
De acordo com os meus conhecimentos, a Tecnologia EDGE foi desenvolvida para
viabilizar a Transmissão de dados em cima de redes TDMA.
Já vi em diversos artigos que o GPRS " tende" a evoluir para tecnologia
....... dada a esta informação:
1) O que basicamente difere o GPRS do EDGE ? Principalmente no que diz
respeito a BW + Tx de Transmissão.....
2) A técnica de acesso ao meio do TDMA e do GSM são diferentes ... como é
possível viabilizar a transmissão de sinais do GSM em cima do TDMA ?
Agradeço a atenção de todos
Prezado Juarez,
Posso pegar um gancho nesta sua precisa cogitação e acrescentar mais algumas
- aos colegas especializados no assunto ?
Vá lá então: gostaria de saber como, operacionalmente, se dá esta
transposição de tecnologias (TDMA para GSM).
Qual a melhor estratégia técnica ? Adicionar antenas novas (GSM) aos pontos
antigos, preservando, nesses, as antenas TDMA?
Os pontos (ERBs, por ex.) passam a funcionar então com dupla estrutura
física (antenas/GSM e TDMA), pois os assinantes terão de optar pelo up-grade,
e, até lá, a rede antiga (TDMA) tem de continuar funcionando e atendendo a
todos (novos e antigos usuários) ?
Ou a tecnologia nova (GSM) é instalada com aproveitamento do hardware antigo
(da antena antiga) ?
Nessa última hipótese, se afirmativa, como se dá isso, se a multiplexação se
opera por divisão de tempo no uso dos canais, na tecnologia TDMA ?
Agradeço antecipadamente o esclarecimento.
Pessoal,
Vou tentar não escever muito. Quando a turma da Industrial Light and Magic
ou da Pixar Studios vai preparar um novo filme, a primeira coisa que eles
fazem é uma versão simplificada das imagens, formada apenas por linhas e
pontos, chamada de wireframe. Pois bom, vamos a uma imagem em wireframe da
questão.
Primeiro vou deixar bem claro minha posição quanto a todos os processos de
transmissão de dados sobre infra-estrutura de telefonia celular (AMPS, TDMA,
GSM e CDMA).
Como profissional de comunicação de dados, acho isso tudo a camada física (TCP/IP,
ou, para os puristas, OSI camada física e camada de enlace) mais complicada
do mundo!! Temos mais uma edição do clássico problema de engenhar transporte
de dados sobre uma infra-estrutura que foi pensada para ser eficiente no
transporte de voz, ou seja, estamos tentando ensinar truque novo a cachorro
velho.
De qq forma, vamos ao assunto.
Tanto o TDMA quanto o GSM foram bolados para sucederem a estrutura de
telefonia celular analógica de 1a. geração (o AMPS), sem criar uma ruptura
que complicasse o deployment para as operadoras.
Essencialmente, o que foi feito foi acrescentar time division multiplexing (TDM)
por cima de um esquema legacy de frequency division multiplexing (FDM).
Em cada banda reservada para a operação do serviço (A, B, C, D, E, ...)
existe uma divisão em canais (FDM).
A utilização dos canais é dividida em time-slots (TDM), e a capacidade de
transmissão depende da largura de banda do canal (porque? Leia Shannon) e da
duração dos time-slots (que define quantas transições de estado do
canal podem ser "socadas" naquele tempo).
Como disse antes, tudo foi montado pensando no transporte de voz. Voz
digitalizada, neste caso.
Com o uso de vocoders sofisticados podemos limitar consideravelmente
a quantidade de bps dos fluxos de voz (até 8 Kbps, comparado com os 64 Kbps
do PCM tradicional).
Com técnicas de modulação "fancy" podemos limitar o baud rate
do canal, e com isso tudo, um usuário de voz pode ser acomodado
tranquilamente em dois time-slots (um para uplink e outro para
downlink - afinal de contas, a comunicação é full-duplex).
Começamos a tentar transmitir dados usando a mesma estrutura de transporte
de voz. Estes serviços CSD (circuit-switched data) tinham o problema
de modulação ineficiente e limitação de banda (1 canal, 2 time-slots). Daí
porque eles só conseguiam taxas efetivas de transmissão da ordem de 19 Kbps.
Como melhorar isso? Um caminho óbvio é melhorar o encoding dos dados,
conseguindo que uma única transição de estado do meio represente mais bits
do sinal original.
Outra é, já que não dá para mexer na largura de banda dos canais (isso
complicaria demais a convivência com a base instalada), vamos alocar mais
time-slots para transmissão, o que me dá mais tempo para transmitir os
símbolos encoded do sinal original.
Claro que, se um usuário de dados "come" mais time slots que um
usuário de voz, vc ainda tem o problema que um número relativamente reduzido
de usuários de dados pode saturar a capacidade da célula, e impedir o acesso
de usuários de voz (de onde ainda vem o grosso da receita, portanto isso não
parece uma boa idéia).
Então, como superar isso?
Encontrando uma maneira de alocar de forma mais inteligente o total de
time-slots disponível para a demanda. Desta forma, a quantidade de
time-slots que um usuário utiliza é variável ao longo da sua sessão de
uso, e quando ele não está transmitindo ou recebendo, os mesmos
time-slots podem ser reutilizados para outros usuários.
Tanto o GPRS quanto o EDGE usam, em graus variados, ambas as técnicas.
Não sou especialista o suficiente para dizer como.
Aliás, se alguém puder me explicar, estou curioso.
Grosso modo, os mesmos problemas e soluções (com as devidas adaptações de
canais/time-slots para códigos) se aplicam ao caso do CDMA (1XRTT,
1XEVDO e 1XEVDV).
Grosso modo, este é o wireframe. O resto, como no trabalho de
animação, é acrescentar texturas, iluminação, cenários, etc. Agora me digam:
é ou não a camada física mais complicada do mundo?
[ ]'s
José Smolka
Voice over IP e a Identificação de Chamada
----- Original Message -----
Sent: Tuesday, September
21, 2004 10:34 AM
Subject: Re: [Celld-group] Voice over
IP
Jussara,
Vc fez a seguinte pergunta:
O interessante é que, por mais que eu consulte POR QUE os
telefonemas via IP apresentam qualquer número no bina, ninguém me responde o
motivo.
Bom. O início da resposta está numa frase que consta do verbete "IP
telephony" que vc nos enviou:
The integration of packet-switched IP with the traditional
SS7-based telephone system is a complex undertaking with numerous
protocols competing for attention.
O assim chamado BINA (assinante B - receptor da chamada - identifica o número do assinante A - originador da chamada) depende, em telefones convencionais, de que a informação sobre o número de A seja passada para o
aparelho de B pela central local (onde B está diretamente conectado).
Como a maioria dos telefones convencionais ainda é analógica, esta sinalização é passada pela central no sistema DTMF (combinações de tons, que tem significados específicos para o aparelho, tais como "tem alguém querendo falar com vc", ou, no nosso caso, "quem está ligando para vc é o número xyz").
A central, por sua vez, recebe as informações sobre a originação e encaminhamento da chamada através de um canal de comunicação separado.
O conjunto dos protocolos usados para isso (definidos pela ITU, estilo OSI) são conhecidos como "sistema de sinalização número 7"ou, para os íntimos, SS7.
Quando a chamada é originada em um telefone convencional, e supondo que todas as centrais envolvidas (local de A, local de B e centrais trânsito no meio do caminho) compartilham o mesmo conjunto de protocolos de sinalização, o aparelho do assinante B consegue receber dados confiáveis sobre o número de A, e exibi-lo corretamente no seu display (o BINA).
Mas, como a citação do verbete da enciclopédia diz, é complicado "casar" a sinalização de chamadas VoIP com a sinalização SS7 das centrais convencionais.
Começa que, estritamente falando, não é necessário atribuir um "número de telefone" para um usuário que quer originar uma chamada VoIP.
No contexto de redes IP, a identificação do usuário é completamente diferente das redes de telefonia (basta ver, por exemplo, seu endereço de e-mail).
Se a chamada é originada e terminada somente com aplicações VoIP, a aplicação usada pelo receptor provavelmente usará uma identificação do tipo "userid@hostid" para identificar o originador, e estes dados são passados normalmente como parte do handshake no nível de aplicação dos protocolos de sinalização usados em VoIP.
O problema começa quando um usuário VoIP inicia uma chamada que será terminada na rede
telefônica convencional. Em algum ponto haverá um gateway para converter de um fluxo de pacotes IP (vindos do originador da chamada) para um conjunto de circuitos comutados na rede
telefônica convencional, interligando o gateway com o usuário de destino. Para estabelecer estes circuitos, o gateway precisa interagir com a central
telefônica no modo habitual dela: SS7.
Considerando que:
a) Existem "trocentos" fornecedores de aplicação que implementam gateways VoIP-POTS;
b) Não há normas específicas para os serviços de VoIP e interligação VoIP-POTS;
c) A ANATEL não assumiu o papel da antiga TELEBRÁS no quesito de estabelecimento de normas técnicas para o mercado brasileiro de telecom;
Vc pode concluir que o potencial de confusão no mapeamento dos dados de sinalização na passagem VoIP-SS7, exceto aqueles que são críticos para o estabelecimento da chamada (e identificação de A não está nesta categoria), é muito grande. E, definitivamente, pela sua experiência relatada, ocorrem.
Antes de começar um discurso do tipo "mas as operadores deviam...", pense nas conseqüências
dos "considerandos" acima. Uma operadora em particular só tem poder de padronizar os serviços que ela mesma presta (e mesmo isso,
francamente, é muito "bagunçado" - e não só no Brasil).
Se a originação da chamada vier da rede de outra 0peradora, a menos que elas consigam um padrão comum para troca dos dados de sinalização VoIP (difícil, nas
circunstâncias atuais) os dados perdem confiabilidade.
Se a chamada é originada na Internet, o problema é ainda pior.
Ainda tem muito trabalho a ser feito nesta área. Muito ainda tem de ser aprendido pelos engenheiros de telecom (das operadoras e dos fornecedores) sobre como lidar eficientemente com as peculiaridades de aplicações em
ambiente packet-switching.
O que temos hoje é apenas um embrião, cheio de possibilidades.
A postura com relação à maneira como estes serviços são prestados, hoje, pode ser pessimista ou otimista.
Eu, particularmente, prefiro achar que o copo do VoIP está meio cheio.
José de Ribamar Smolka Ramos
Transmissão Espacial
----- Original Message -----
From: jose.smolka@vivo.com.br
To: Celld-group@yahoogrupos.com.br
Sent: Friday, April 16, 2004 5:56 PM
Subject: Re: [Celld-group] Transmissão Espacial
Pergunta: Se a tranmissão entre antenas é a perturbação do campo eletromagnético do meio... e sabemos que a terra possui tal
campo... como é feita a transmissão espacial? Qual campo é perturbado, por exemplo, numa
transmissão de Marte para a Terra? Os campos dos planetas no percurso? Existem tais campos além das atmosferas dos planetas?
Gente, de vez em quando eu saio da toca para comentar algum assunto que achei interessante, e é o caso com a pergunta do Tassilu, que na verdade não é sobre engenharia, e sim sobre física.
A resposta começa com a descoberta da existência de ondas eletromagnéticas, feita por Herz no final do século XIX. Naquela época fenômenos ondulatórios já eram conhecidos dos físicos, mas todos os casos conhecidos até ali
exigiam algum suporte material para o transporte das ondas. Na falta de idéia melhor, na época foi proposta a existência de uma substância difusa por todo o universo, denominada "éter", e que serviria como suporte físico
da propagação das ondas eletromagnéticas.
Ainda no século XIX, o trabalho de Maxwell provou que a presença do éter era completamente dispensável. BTW, as experiências de Michelson e Morley, que provaram a invariância da velocidade da luz, jogaram a pá de cal no
conceito do éter. Então como é que podemos descrever a propagação das ondas eletromagnéticas? Usando o conceito de campo vetorial. Existe uma grande discussão filosófica (que eu não vou entrar aqui) sobre se o conceito de campo (vetorial ou escalar) é apenas uma construção matemática útil para descrever o comportamento dos objetos estudados, ou se isso nos diz alguma coisa sobre a própria estrutura básica do Universo. Filosofia à parte, as equações de Maxwell são descrições sobre o comportamento dinâmico dos campos (vetoriais) elétrico e magnético. Conhecidas as distribuições espaciais (estáticas e dinâmicas) de carga elétrica e magnética (as
condições de contorno), obtemos equações diferenciais lineares (atenção para este lineares!!) que permitem
determinar os vetores E e B em qualquer ponto do espaço e em qualquer instante do tempo.
Vamos imaginar o vácuo. Isso corresponde à ausência de cargas (elétricas ou magnéticas), e produz soluções das equações de Maxwell que dizem que o vetor E e o vetor B são nulos em todos os pontos do espaço, e que esta
situação é constante no tempo. Introduza cargas estáticas no cenário anterior, e a solução das equações mostra uma situação onde os vetores E e B possuem valores diferentes nos diversos pontos do espaço, mas estes valores não variam no tempo. Fazendo estas cargas se movimentarem, a solução das equações nos dá valores de E e B dinâmicos também no tempo, ou seja: E=f(x,y,x,t) e B=g(x,y,z,t), onde f e g são funções vetoriais.
Voltando ao fato das equações serem lineares (lembram?). Isso permite a superposição linear dos sinais, o que é a mesma coisa que dizer que o as funções f e g citadas acima podem ser vistas como o somatório de diversas
funções isoladas, cada uma resultante de eventos individuais. A analogia útil é a seguinte: imagine um tanque de água em repouso. Se você jogar várias pedras no tanque, a superfície irá apresentar um padrão ondulatório
complexo (o termo que costumamos usar par isso é ruidoso), mas este padrão pode ser decomposto como uma soma de padrões mais simples, causados pela queda de cada pedra individualmente.
Então, quando injetamos um sinal eletromagnético (por exemplo, usando uma antena) dentro do "mar de ruído" de todos os outros sinais superpostos linearmente (os campos gerados pelos
outros transmissores de sinais, pelos
planetas, pelo sol, pela própria terra, pela radiação cósmica de fundo, pelas explosões de supernovas, pelos pulsars e quasars, etc. etc. etc. ), o nosso sinal se propaga, misturado nessa soma complexa, mas, mediante as
técnicas adequadas, ele poderá ser isolado do ruído de fundo na recepção.
Resumindo: nós não estamos "perturbando" algum componente dos campos eletromagnéticos de fundo (o ruído) para transmitirmos o nosso sinal. Não há necessidade de nenhum campo prévio para que o nosso sinal se propague.
Na verdade, se houvesse uma região do espaço onde houvesse um vácuo de radiação, ali o nosso sinal seria detetável como a única perturbação dos campos elétricos e magnéticos. Em todos os outros lugares, o nosso sinal é
apenas mais um dos vários sinais superpostos linearmente, o que dá a impressão que os vetores E e B estão variando aleatoriamente de um ponto do espaço para outro, e de um instante do tempo para outro.
P.S.: Para os físicos de plantão, até a última vez que eu andei fuçando este assunto, a compatibilização das equações de Maxwell com a teoria quântica é uma teoria denominada eletrodinâmica quântica. As forças
nucleares forte e fraca são incorporadas na teoria da cromodinâmica quântica, e existem teorias (ainda não muito sólidas) que unificam as descrições da eletrodinâmica e cromodinâmica quânticas. Falta uma teoria quântica da gravidade que compatibilize a teoria quântica e a teoria da relatividade geral, para depois ser possível obter a chamada teoria da grande unificação, que poderia explicar, entre outras coisas, como era o universo nos primeiros 10E-43 s após o big bang.
José Smolka
Telebahia Celular S/A - VIVO
Rua Silveira Martins 1036, Cabula, CEP 41150-000, Salvador - BA, Brasil
Fone: 55-71-3877815, Cel.: 55-71-99802650
|