The Problem of Induction


The cause and effect framework is a natural way of human thinking


There's a branch in philosophy concerning the validity, nature, and other issues in the scientific reasoning, this branch is known as Epistemology, from Greek "study of the knowledge",

In this post we will reason about the inferencial aspect of reasoning, it is how we know that a phenomena A causes a phenomena B, in formal syntax ($A \rightarrow B$)?


In fields like Philosophy, Mathematics, and some times Physics, the corpus of knowledge resides in axioms, theorems and pure forms. So every conclusion could be obtained by a natural deduction over the initial truths.

  1. forAll(x, Gx -> Hx)      P            // premise
  2. forAll(x, Hx -> ~Ix)     P            // premise
  3. Ga -> Ha                  1 E.forAll  // eliminate forAll in 1
  4. Ha -> ~Ia                 2 E.forAll  // eliminate forAll in 2
  5. Ga -> ~Ia                 3,4 SH      // hypothetic silogism in 3 and 4
  6. forAll(x, Gx -> ~Ix)      5 I.forAll  // introduces forAll

For example, Einstein with a pure mathematical reasoning deduced the "$e = mc^2$" formula.


For other bodies of knowledge, like Psychology, Economy, Epidemiology, is not possible (at least for know) to obtain perfect information about the studied object. There's instrumental erros, randomized outputs given human dependecy, etc.

Observação de corpos celestes: F = GMm/r^2

Ex: x conduz eletricidade
Mx: x é um metal.

1. Ef ^ Mf // iron conducts eletricity and is a metal
2. Ec ^ Mc // copper conducts eletricity and is a metal
3. Eg ^ Mg // gold conducts eletricity and is a metal
4. Es ^ Ms // silver conducts eletricity and is a metal

So, every metal conducts eletricity...

    forAll(x, Mx -> Ex)

Or, every conductor of electricity is a metal??

    forAll(x, Ex -> Mx)

Water conducts eletricity, but isn't a metal.

Metals conducts eletricity, which is truth for this case, but can be coincidence for other correlations.

If A and B are correlated, how we know if A causes B ($A \rightarrow B$), or B causes A ($B \rightarrow A$), or they are just mutually causes by a third part, Z ($Z \rightarrow A \land Z \rightarrow B$)??

The "Problem of Induction"

It is a famous epistemological problem the begins with the "Enquiry on Human Understading" written by David Hume in XXX where he YYYYY How we know if a hypothesis is general enough?

, later in XXX, Immanuel Kant in his "Critique of Pure Reason" argues that YYYY.

Firstly we need to formulate a hypothesis - Impossível ter certeza no raciocínio indutivo.

- Busca pela conclusão mais provável e por contra exemplos.

- Infinitas funções podem explicar um par (observações,propriedades)

Probability at Rescue

Hume horns

A Perfect Induction System

Given that we have the data that really describes and observable phenomena, this framework garantees to find the best (most probable) hypothesis.

*** O "Problema da Indução"

*** Navalha de Ockham e a Indução Universal de Solomonoff

- Se o mundo pode ser descrito por programas de computador, programas menores são
  mais prováveis de serem tal descrição. (Teoria da Probabilidade Algorítmica)

- Indução Universal não é computável (Problema da Parada).


- Certas questões do aprendizado de máquina só podem ser explicadas pela teoria
   do aprendizado computacional, não pelo aprendizado estatístico.

- Computação tem importância tanto prática (engenharia) quanto teórica para o
   aprendizado de **máquina** (limites da máquina).

- Recursos são finitos, tempo, espaço, custos, Nubank por exemplo implementa suas
   máquinas de inferência em Clojure/Spark, R não é viável.

- SVMs tem uma teoria estatística brilhante (Dimensão VC, kernels R^infinito) mas
   entraram em desuso pelo alto custo computacional e resultados práticos limitados.

- Teoria do "Aprendível"/Provavelmente Aproximadamente Correto, podemos aprender
   um função de criptografia se tivéssemos os pares (rawtext, encryptedtext)?

- Podemos resolver quais classes de problemas  com aprendizado de máquina? P? NP? BQP?

- Computadores tem precisão finita, não operamos por Reais mas sim por Reais
   Computáveis (conjunto contável e na prática finito), o que gera implicações e
   limitações teóricas.