Em 1943, W. McCulloch e W. Pitts [1] desenvolveram um modelo que propõe elementos computacionais retirados das propriedades fisiológicas de um neurônio biológico e de suas conexões, introduzindo assim a referência número um para a teoria de Redes Neurais Artificiais.
O neurônio de McCulloch-Pitts é um dispositivo que possui um conjunto de entradas x=[x1, x2, . . .,xn]’. Associado a cada entrada existe um ganho sináptico w=[w1, w2, . . ., wn]’, que pode ser excitatório (wi>0), ou inibitório (wi<0). O dispositivo também possui uma saída binária, representando um de dois estados possíveis, 0 e 1 ou –1 e 1. Para determinar a saída do neurônio faz-se a integração sináptica, ou seja, calcula-se a soma ponderada das entradas com seus respectivos ganhos sinápticos,
y = ∑i=1n wixi = w’x
Se a soma y for maior ou igual a um limiar T o neurônio torna-se ativo e a saída é um pulso (z=1), se não permanece inativo e a saída é um não pulso (z=-1), i.e.
z = f(y-T)
A função f é chamada de função de transferência, normalmente aproximada por uma função degrau f(x)=h(x) ou sinal f(x)=sgn(x).
Com a incorporação do limiar na soma ponderada, w0=T, podemos daqui por diante simplificar a notação escrevendo
∑i=1n wixi-T = ∑i=0n wixi
onde w0=T e x0=-1.
A rede neural de uma única camada
Abaixo ilustramos a estrutura de uma rede de uma única camada com L neurônios de McCulloch-Pitts. Teremos, então, n entradas e L saídas. Cada unidade neuronal tem como entrada todas as n variáveis xi. Associado a cada entrada i, do neurônio l, existe um ganho wli, portanto, W=[wli]. Agora, as equações do Neurônio de McCulloch-Pitts sofrem uma pequena modificação
y = ∑i=1n wlixi = Wx
Cada neurônio possui um limiar diferente, então T=[T1, T2, . . ., Tn]’. Neste caso,
z = f(y–T)
A função f é chamada de função de transferência, normalmente aproximada por uma função degrau f(x)=h(x), sinal f(x)=sgn(x) ou sigmóide f(x)=tanh(x).
Com a incorporação do limiar na soma ponderada, w0=T, podemos daqui por diante simplificar a notação para
∑i=1n wixi-T = ∑i=0n wixi
onde w0=T e x0=-1.
O neurônio como ferramenta para reconhecimento de padrão
Sabemos que o gráfico de uma função g(x,y)=0 é usualmente uma curva da plano xy, como uma função g(x,y,z)=0 é usualmente uma superfície no espaço xyz. Exatamente da mesma maneira uma função do tipo g(x,y,z,w,…) representa um hipersuperfície no espaço euclidiano Rn, de n dimensões.
Portanto, considerando a expressão
g(z,x) = z-f(y-T) = 0
do o neurônio de MacCulloch-Pitts, podemos dizer que g(z,x) representa um hipersuperfície que divide o espaço euclidiano Rn+1, {xi} U z, em duas regiões A e B. Assim, um vetor x estará em uma destas regiões. Por exemplo, quando o valor de saída for z=1 então x pertence à região A e quando z=-1 então x pertence à região B. Irei explorar esta questão com exemplos num próximo post.
[1] McCulloch, W., and W. Pitts. 1943. A logical calculus of the ideas imminent in nervous activity. Bulletin of Mathematical Biophysics 5: 115-33 (link).