Neurônio de McCulloch-Pitts

Em 1943, W. McCulloch e W. Pitts [1] desenvolveram um modelo que propõe elementos computacionais retirados das propriedades fisiológicas de um neurônio biológico e de suas conexões, introduzindo assim a referência número um para a teoria de Redes Neurais Artificiais.

O neurônio de McCulloch-Pitts é um dispositivo que possui um conjunto de entradas x=[x₁, x₂, . . .,x_n]’. Associado a cada entrada existe um ganho sináptico w=[w₁, w₂, . . ., w_n]’, que pode ser excitatório (w_i>0), ou inibitório (w_i<0). O dispositivo também possui uma saída binária, representando um de dois estados possíveis, 0 e 1 ou –1 e 1. Para determinar a saída do neurônio faz-se a integração sináptica, ou seja, calcula-se a soma ponderada das entradas com seus respectivos ganhos sinápticos,

y = ∑_i=1ⁿ w_ix_i = w’x

Se a soma y for maior ou igual a um limiar T o neurônio torna-se ativo e a saída é um pulso (z=1), se não permanece inativo e a saída é um não pulso (z=-1), i.e.

z = f(y-T)

A função f é chamada de função de transferência, normalmente aproximada por uma função degrau f(x)=h(x) ou sinal f(x)=sgn(x).

Com a incorporação do limiar na soma ponderada, w₀=T, podemos daqui por diante simplificar a notação escrevendo

∑_i=1ⁿ w_ix_i-T = ∑_i=0ⁿ w_ix_i

onde w₀=T e x₀=-1.

A rede neural de uma única camada

Abaixo ilustramos a estrutura de uma rede de uma única camada com L neurônios de McCulloch-Pitts. Teremos, então, n entradas e L saídas. Cada unidade neuronal tem como entrada todas as n variáveis x_i. Associado a cada entrada i, do neurônio l, existe um ganho w_li, portanto, W=[w_li]. Agora, as equações do Neurônio de McCulloch-Pitts sofrem uma pequena modificação

y = ∑_i=1ⁿ w_lix_i = Wx

Cada neurônio possui um limiar diferente, então T=[T₁, T₂, . . ., T_n]’. Neste caso,

z = f(y–T)

A função f é chamada de função de transferência, normalmente aproximada por uma função degrau f(x)=h(x), sinal f(x)=sgn(x) ou sigmóide f(x)=tanh(x).

Com a incorporação do limiar na soma ponderada, w₀=T, podemos daqui por diante simplificar a notação para

∑_i=1ⁿ w_ix_i-T = ∑_i=0ⁿ w_ix_i

onde w₀=T e x0=-1.

O neurônio como ferramenta para reconhecimento de padrão

Sabemos que o gráfico de uma função g(x,y)=0 é usualmente uma curva da plano xy, como uma função g(x,y,z)=0 é usualmente uma superfície no espaço xyz. Exatamente da mesma maneira uma função do tipo g(x,y,z,w,…) representa um hipersuperfície no espaço euclidiano Rⁿ, de n dimensões.

Portanto, considerando a expressão

g(z,x) = z-f(y-T) = 0

do o neurônio de MacCulloch-Pitts, podemos dizer que g(z,x) representa um hipersuperfície que divide o espaço euclidiano Rⁿ⁺¹, {x_i} U z, em duas regiões A e B. Assim, um vetor x estará em uma destas regiões. Por exemplo, quando o valor de saída for z=1 então x pertence à região A e quando z=-1 então x pertence à região B. Irei explorar esta questão com exemplos num próximo post.

[1] McCulloch, W., and W. Pitts. 1943. A logical calculus of the ideas imminent in nervous activity. Bulletin of Mathematical Biophysics 5: 115-33 (link).

Arquivo de Posts

Contato