lunes, 19 de septiembre de 2011

La belleza de las matemáticas

Sí, las matemáticas son bellas. A muchas personas les parecerá rara esta afirmación, pero intentaré explicarla con dos ejemplos sencillos. Todos hemos estudiado en la escuela la propiedad elemental de las fracciones: si multiplicamos o dividimos el numerador y el denominador de la fracción por un mismo número, el valor numérico de la fracción no varía. Podemos comprender este hecho elemental a partir de un dibujo, o bien deducirlo en un curso de álgebra elemental. Pero lo extraordinario del asunto es que si tomamos cualquier fracción verdadera y multiplicamos realmente el numerador y el denominador por cualquier número, el valor numérico de la fracción resultante es efectivamente el mismo que el de la fracción original, como podemos comprobar si efectuamos realmente las divisiones del denominador entre el denominador, respectivamente, de la primera fracción y de la segunda. Y ello, no importa cuantas veces hagamos la prueba; siempre vamos a obtener el resultado correcto. En realidad, no necesitábamos hacer ninguna prueba con números, puesto que, anticipadamente, ya sabíamos que íbamos a obtener un resultado correcto gracias a nuestra comprensión de la propiedad fundamental de las fracciones; puesto que hemos entendido que dicha propiedad ha de ser verdadera, sabemos que va a cumplirse en todos los casos en que la necesitemos ¿No es esto maravilloso?

Otro ejemplo: supongamos que resolvemos una ecuación sencilla, por ejemplo, de primer grado con una incógnita. Su resolución se basa en unas pocas propiedades de las igualdades que comprendemos intuitivamente, como que si a los dos miembros de una igualdad los sometemos a las mismas operaciones (les sumamos o restamos la misma cantidad, o los multiplicamos o dividimos por un mismo número) obtendremos otra igualdad. Aplicando estas propiedades sucesivamente, obtenemos el valor numérico de la incógnita. Y ahora surge la maravilla: si sustituimos el valor hallado en la ecuación original y hacemos las operaciones correspondientes en cada miembro de la ecuación, ¿qué obtendremos? Obviamente, obtendremos una igualdad. No importa con cuantas ecuaciones probemos o cómo sean de complicadas: si las hemos resuelto correctamente, sin cometer ningún error, sabemos que cuando sustituyamos el valor de la incógnita vamos a obtener al final una igualdad; y si no obtenemos una igualdad, sabemos ciertamente que hemos cometido algún error, bien en la resolución de la ecuación o bien en la comprobación. En realidad, sabemos a priori y con absoluta certeza que, si hemos resuelto correctamente la ecuación, cuando realicemos la substitución vamos a obtener una igualdad; si realizamos realmente la substitución será a modo de comprobación, y no porque dudemos de las propiedades de las igualdades que hemos aplicado, que sabemos que son absolutamente ciertas.

En esta certeza absoluta, en nuestra confianza en las verdades matemáticas una vez comprendidas, en esta armonía entre las propiedades abstractas y los resultados concretos, radica para mí al menos una parte de la belleza de las matemáticas. Las matemáticas expresan una verdad absoluta, lógica, cierta, más allá de cualquier duda, que se basa en el poder de nuestro razonamiento. Las verdades matemáticas siempre son coherentes, y los resultados concuerdan siempre unos con otros (una teoría matemática basada en unos axiomas de los cuales se deduzcan resultados contradictorios será inmediatamente rechazada). Cuando explico a mi hijo de trece años las matemáticas escolares le digo que las matemáticas son bellas porque siempre son verdaderas, siempre nos son fieles, nunca nos engañan, nunca nos fallan; por tanto, nosotros tampoco podemos intentar engañarlas: si intentamos resolver una ecuación (o resolver cualquier problema) “por la vía rápida”, saltándonos las reglas, haciendo trampas, obtendremos un resultado incorrecto, y cuando intentemos hacer la comprobación ésta resultará negativa.

Esta verdad y esta coherencia profundas se encuentran más allá de nuestro mundo real; son propiedades de entes abstractos, de los “objetos” ideales del mundo platónico. En cambio, nuestro mundo real está siempre sujeto a la incertidumbre y a la imperfección (que también tiene su parte de belleza, pero de otro tipo), y sólo por aproximación se asemeja a este mundo platónico. La longitud de la circunferencia es igual a “dos pi erre” (con un valor de pi con infinitas cifras decimales y que además coincide –otra maravilla– con el valor de una abstrusa integral del análisis matemático) sólo para las circunferencias del mundo platónico; la circunferencia de cualquier objeto de nuestro mundo real con forma “circular” sólo alcanzará dicho valor de manera aproximada, porque siempre contiene irregularidades. Y es ese sentimiento de verdad y de perfección absoluta la que otorga una parte de belleza a los entes matemáticos del mundo platónico.

Mi acercamiento a las matemáticas es únicamente a nivel de aficionado, pues mi profesión y mis otras aficiones van por caminos muy diversos. Mis conocimientos de matemáticas no van más allá de lo que se estudia en primero o segundo curso de físicas –la física y las matemáticas siempre han hecho una excelente pareja–. Pero puedo asegurar que la sensación de verdad absoluta, de coherencia global, es básicamente la misma que he indicado para los casos elementales, quizá más refinada conforme el contenido se va haciendo más complejo. Cuando entendemos una demostración más o menos complicada, cuando resolvemos un problema físico o matemático y vemos que la solución ha de ser necesariamente correcta porque concuerda con otros aspectos de la teoría, cuando apreciamos la armonía de una rama matemática, no podemos dejar de experimentar un sentimiento de goce y de satisfacción, como una especie de visión momentánea del mundo de perfección platónica que se nos ha mostrado por unos instantes, como un instante de contemplación y de acercamiento a la belleza y a la verdad en el sentido más absoluto.

No espero haber convencido a nadie con mi torpe palabrería, y supongo que todos aquellos que odian las matemáticas continuarán odiándolas. Sólo espero haber expresado mis sentimientos personales respecto a la belleza matemática, y hacer comprender que los que amamos las matemáticas no somos “bichos raros”. Nuestro sentimiento es comparable quizá a quien percibe la belleza a través de una fuga de Bach, de una sinfonía de Beethoven, de un cuadro de Rafael o de Picasso, de una catedral gótica, de la lectura de un poema o de una novela o de la contemplación de un cuerpo hermoso, o simplemente sintiéndose al lado de la persona amada. Afortunadamente, y como dice el aria famosa de Tosca, en el mundo existe una “Recondita armonia di bellezze diverse!”... Y no necesariamente las “bellezas diversas” son siempre incompatibles entre sí.

Sobre la utilidad de las matemáticas

Sobre la utilidad directa de las matemáticas”, en Gaussianos.

Las matemáticas son útiles porque, además de sus innumerables aplicaciones en todos los campos de la ciencia y de la vida cotidiana, son bellas.

sábado, 30 de abril de 2011

¿La homeopatía funciona realmente?

“Ante afirmaciones extraordinarias, deben exigirse pruebas extraordinarias” (Carl Sagan; la cita no es exacta, pero es bastante aproximada y resulta oportuna).

Pues no, la homeopatía no funciona. Se trata de una pseudociencia; es decir, una doctrina que pretende pasar por científica sin cumplir ninguno de los requisitos exigidos por el método científico. Más exactamente, es una pseudomedicina; en este caso, una terapia completamente falaz, como otras que mencionaremos al final de este escrito. En una palabra: una superchería.

Partiendo de la caracterización general de las pseudociencias y las pseudotecnologías que el eminente filósofo de la ciencia Mario Bunge hizo en su excelente libro Seudociencia e ideología (Alianza Universidad, 1985), intentaremos aplicar una versión resumida de esta descripción a la homeopatía. Ésta cumple las siguientes características, propias de dichas falsificaciones:

1. Contar con una comunidades de creyentes y practicantes (no de investigadores). La industria homeopática gasta mucho menos dinero en investigación que la industria farmacológica científica, puesto que, como consecuencia de la presión de las empresas que los fabrican, para la venta de productos homeopáticos no se exige haber demostrado su eficacia. Sus practicantes y creyentes actúan con una fe muchas veces inmune a los argumentos racionales. Las “investigaciones” que realizan los partidarios de la homeopatía suelen ser sobre todo las basadas en estudios patogenéticos, es decir, en averiguar los efectos producidos por diversas sustancias en individuos sanos para tratar de relacionarlos por su similitud con los síntomas de una persona enferma a fin de aplicar el principio homeopático de la similitud; no obstante, el origen de muchos “medicamentos” homeopáticos se basa únicamente en la tradición.

2. Basarse en una ontología que admite la violación de leyes naturales, o bien la existencia de entes o procesos inmateriales. La homeopatía viola las leyes de la física, la química y la biología, y se basa en procesos no materiales: “energías” y “fuerzas” vitales, “armonía” o “desequilibrio” en la “energía vital”, “memoria del agua”, etc. Un medicamento homeopático típico está tan diluido que consiste esencialmente en agua prácticamente pura, sin apenas rastro de la sustancia original (o sin ninguna molécula de la misma, en muchas de las disoluciones que emplean los homeópatas); el agua pura no puede tener los efectos curativos que se les suponen a los medicamentos homeopáticos, contrariamente a que sucede con los medicamentos científicos, que se basan en procesos químicos comprobados experimentalmente. El principio homeopático de la similitud (curación por lo semejante) es contrario a las leyes de la bioquímica.

3. Una gnoseología que admite argumentos de autoridad o maneras paranormales de conocimiento. La homeopatía se basa en la “autoridad” de un solo personaje (Samuel Friedrich Hahnemann, 1775-1843), cuyas teorías se basaban en los principios anteriores al pleno desarrollo del conocimiento médico científico, en una época en que la práctica sanitaria consistía en poco más que la aplicación de purgas, sangrías y la administración de sustancias altamente tóxicas. Los dogmas de Hahnemann no han sido analizados y revisados a la luz de los conocimientos modernos, y los homeópatas actuales hacen caso omiso de todos los avances en química, biología, farmacología, cirugía, etc., que son la base de las técnicas curativas de la medicina científica moderna.

4. Un fondo de conocimientos pobre, estancado, con hipótesis incontrastables o incompatibles con las ciencias y métodos injustificables y ajenos al método científico. La homeopatía prácticamente no ha evolucionado desde sus orígenes, y se basa en hipótesis incontrastables, como el principio de la similitud, según la cual sustancias que producen efectos similares a los síntomas de ciertas enfermedades curan dichos síntomas si están suficientemente diluidas (similia similibus curantur), y el principio de las disoluciones infinitesimales, según el cual disolviendo el principio activo de forma que sólo quede de él una cantidad infinitesimal en la disolución se reduce la toxicidad de la sustancia pero se aumenta su poder curativo. Ambas hipótesis no han sido comprobadas mediante el método científico, y, como hemos indicado anteriormente, son incompatibles con los conocimientos científicos firmemente establecidos por la física, la química y la biología.

El principio homeopático de la similitud no es equiparable al mecanismo de la vacunación, pues en éste una pequeña cantidad de bacterias inocuas estimulan los mecanismos biológicos inmunológicos produciendo anticuerpos específicos que sirven como prevención (no como curación) de una enfermedad determinada, mientras que en la hipótesis homeopática las sustancias actúan supuestamente según mecanismos desconocidos produciendo efectos que casualmente se parecen a los síntomas de la enfermedad, pero no están necesariamente relacionados con la misma; desde luego, diluyendo la sustancia activa se reducen los efectos nocivos de ésta en un individuo sano, pero la “deducción” de que esta disolución puede curar los síntomas de un enfermo supone un salto injustificable para el razonamiento lógico: se confunde “menos perjudicial” con “más beneficioso”.

Además, la homeopatía pretende atender o curar a los síntomas de las enfermedades, sin preocuparse por las causas de ésta; por tanto, la homeopatía no tiene en cuenta la relación entre causa y efecto, fundamental en el razonamiento lógico y en cualquier actividad científica.

Respecto a la hipótesis de las disoluciones infinitesimales, recientemente se ha pretendido basar en la supuesta “memoria del agua”, según la cual el agua conserva la memoria de las sustancias que ha contenido en disolución,  pero de una manera misteriosa y mágica, puesto que la sustancia disuelta transmitiría al disolvente sólo sus efectos curativos pero no sus efectos tóxicos. Los únicos experimentos que parecían demostrar algo relacionado con dicha hipótesis (los de Benveniste, publicados en 1988) fueron realizados por investigadores financiados por una famosa empresa homeopática, y no han sido confirmados por investigadores independientes.

Otra de las pretensiones de la homeopatía es la de que atiende al enfermo de manera holística, personalizada, a diferencia de la medicina “alopática”, que sólo trata las enfermedades aisladamente sin tener en cuenta la globalidad del enfermo. Sobre esto, es necesario aclarar que la medicina científica trata la enfermedad, en efecto, pero procurando personalizar al máximo el tratamiento. La concepción exclusivamente holística de la homeopatía es incompatible con la epistemología más adecuada para las ciencias (el reduccionismo sistémico), que, en el caso de la medicina, considera al ser humano como un sistema global con propiedades y características que son mucho más que la suma de las partes, y como tal debe ser considerado y tratado; pero el funcionamiento del organismo y las anomalías del mismo no se pueden comprender sin un análisis de sus partes (órganos y sistemas orgánicos, tejidos...) y la relación entre éstas, análisis que incumbe a la anatomía, la fisiología, etc. y que homeopatía y las pseudomedicinas en general ignoran.

5. Unos procedimientos metódicos que incluyen técnicas infundadas o de eficacia no comprobada. Ninguno de los medicamentos homeopáticos ha demostrado tener una eficacia que vaya más allá del efecto placebo. A pesar de que muchos de ellos se venden en farmacias gracias al vacío legislativo existente, ninguno ha sido aprobado por la Agencia Española de Medicamentos y Productos Sanitarios.

Argumentos paralelos se pueden utilizar respecto a otras pseudomedicinas (mal llamadas medicinas alternativas: no hay ningún método de curación eficaz, comprobado mediante ensayos clínicos rigurosos, que sea “alternativo” a la medicina científica, pues, por definición, si fuera eficaz sería incluido en ella), como la acupuntura, la osteopatía (que no tiene nada que ver con la especialidad médica o de enfermería llamada fisioterapia), la reflexología o reflexoterapia, el quiromasaje (no confundir con el masaje terapéutico a cargo de un fisoterapeuta profesional titulado académicamente), la quiropráctica, la naturopatía (no confundir con el uso tradicional de plantas o hierbas medicinales que contienen los principios activos de determinados medicamentos, pero con una concentración y eficacia menor que en éstos), el psicoanálisis (no confundir con la psicología científica moderna, sobre todo la basada en la neurociencia, y con la psiquiatría médica), la macrobiótica (no confundir con la dietética, estudio científico cuyo objetivo es una alimentación sana), la magnetoterapia (uso de “pulseras mágicas”), la frenología (no confundir con pisar el freno oportunamente cuando se divisa un obstáculo), las medicinas tradicionales china o de la cultura que sea (claro está, tomadas en bloque y aceptando sus presupuestos filosóficos como creencia de manera acrítica, sin tener en cuenta que se trata de saberes precientíficos, que a veces aciertan pero que muchas veces fallan, como todo tipo de “remedios de la abuela”) y las diversas formas de milagrería, curanderismo y santería. Alguna de ellas puede que tenga casualmente alguna vez algún tipo de efecto paliativo beneficioso, sobre todo basado en el efecto placebo, pero este efecto no tiene nada que ver con los principios e hipótesis en que se basan estas pseudomedicinas, totalmente incompatibles con el conocimiento científico y carecen de las propiedades curativas maravillosos que pretenden tener; la mayoría son pura charlatanería. Para cualquier creyente en alguna de estas “disciplinas”, le recomiendo que haga una simple búsqueda por Internet y compruebe si los principios que subyacen en ellas concuerdan con sus conocimientos en ciencias o con la propia lógica y el sentido común.

Aquí os dejo algunas referencias:









viernes, 22 de abril de 2011

Introducció divulgativa a la física moderna (IV)

Amb aquesta entrada acabem la part dedicada a la relativitat especial d’Einstein, amb la paradoxa dels bessons o del viatger de Langevin, l’equivalència entre massa i energia i l’espaitemps de Minkowski.

El viatger de Langevin o la paradoxa dels bessons

A partir dels conceptes de duració pròpia i de duració impròpia, és fàcil entendre l'anomenada paradoxa dels bessons o paradoxa del viatger de Langevin. Un jove astronauta emprèn un llarg viatge a una velocitat constant pròxima a la de la llum cap a un estel pròxim, i deixa el seu germà bessó a la Terra com a testimoni del viatge. El viatge, cronometrat des de la nau espacial (sistema inercial), dura 10 anys (duració pròpia, ja que els esdeveniments que s'esdevenen dins la nau són copuntuals en el sistema de la nau); però cronometrat des de la Terra, com que la nau es desplaça respecte a la Terra, es tracta d'una duració impròpia, major que la pròpia. Per tant, cronometrat des de la Terra, el viatge dura més; per exemple, 30 anys. El viatge de regrés dura, igualment, altres 10 anys mesurats des de la nau (un altre sistema de referència inercial, però distint del de la nau a l'anada), i uns altres 30 anys mesurats en la Terra. Si menyspreem la duració de les acceleracions i de les frenades, el viatge total dura 20 anys en la nau i 60 anys en la Terra. Al regrés de l'astronauta, aquest serà un home madur, però el seu germà bessó, que ha quedat a la Terra, serà un ancià.

Podria argumentar-se, però, que, segons el principi de relativitat, el paper de l'astronauta i del testimoni serien intercanviables, que és la Terra la que viatja respecte a la nau i que hauria de ser el testimoni qui envellís menys que l'astronauta. La situació, però, no és simètrica: la nau és accelerada a l’inici del viatge, i després també experimenta acceleracions quan dóna la volta i inicia el viatge de regrés, mentre que la Terra no experimenta cap acceleració. Si no tenim en compte els temps invertits en les acceleracions i frenades (aproximació que podem fer si el viatge és suficientment llarg), podem utilitzar la relativitat especial i considerar que el viatge d'anada i tornada de la nau es realitza en dos sistemes de referència inercials diferents, mentre que la Terra constitueix un únic sistema de referència inercial. Si fem els càlculs del temps que correspon als tres sistemes implicats, arribarem a la conclusió mencionada: el viatger envelleix menys que el testimoni. Si, a més, si considerem els efectes de l'acceleració (per exemple, podríem fer que la nau accelerés suaument durant la meitat del viatge d'anada i frenés també suaument durant l'altra meitat, i igualment en el viatge de tornada) el resultat seria, qualitativament, semblant; aleshores es tractaria de sistemes accelerats i no podríem aplicar la relativitat especial. Però com veurem més avant, aplicant el principi d'equivalència l'acceleració seria equivalent a l'acció d'un camp gravitatori, i, segons la relativitat general, la mesura del temps per rellotges en presència de camps gravitatoris s’alenteix també; per tant, en el sistema acceletat de la nau passaria menys temps que a la Terra, i l'astronauta envelliria menys que el seu germà bessó testimoni. De fet, el temps propi invertit per la nau seguint qualsevol trajectòria corba (i, per tant, accelerada) fins a tornar al punt de partida en la Terra és menor que el temps impropi mesurat segons un sistema inercial no accelerat (p. ex., el sistema en repòs sobre la Terra).

Un altre efecte espectacular de la relativitat, relacionat amb la paradoxa dels bessons, és la possibilitat de realitzar viatges interestel·lars. Si fossem capaços de construir naus espacials que viatgessen a velocitats pròximes a la de la llum, podríem cobrir les distàncies entre els estels (i fins i tot, entre les galàxies), en un temps relativament curt, compatible amb la duració d'una vida humana. Per exemple, en una nau que viatgés a una velocitat de 0,995c, el viatge d'anada i tornada cap a un estel distant 30 anys llum duraria, vist des de la Terra, un poc més de 60 anys. Tanmateix, aquesta seria la duració impròpia, mesurada des de la Terra. La duració del viatge d'anada i tornada en el sistema de la nau (duració pròpia) seria de poc més de 6 anys.

Aquest efecte es pot analitzar també com a conseqüència de la contracció de la longitud. En efecte, des del punt de vista dels astronautes, aquests realitzen el viatge cap a l'estel a una velocitat quasi igual a la de la llum en un temps propi de 6 anys, ja que el segment Terra-estel, de 30 anys llum en el sistema Terra (distància pròpia, ja que el segment és fix en aquest sistema) queda contret a 6 anys llum en el sistema de la nau (distància impròpia) a conseqüència del moviment relatiu entre la nau i el segment.

Equivalència entre massa i energia

Redefinint adequadament els conceptes de la dinàmica, Einstein demostrà que la massa d'un cos augmenta amb la velocitat fent-se infinita a la velocitat de la llum, la qual cosa imposa un límit, el de la velocitat de la llum, a les velocitats a què és possible accelerar físicament qualsevol objecte material. Les velocitats possibles en un cos amb massa en repòs positiva són sempre inferiors a la de la llum, mentre que les partícules que viatgen a la velocitat de la llum (p. ex., els fotons, quàntums de la radiació electromagnètica) han de tenir massa nul·la.

Cal aclarir, però, que la relativitat no descarta la possibilitat d'existència de partícules que viatgen a velocitat superior a la de la llum. Aquestes eventuals partícules, anomenades taquions, haurien de viatjar sempre a velocitat superior a la de la llum i tenir massa negativa. Tanmateix, els taquions plantejarien greus problemes lògics, ja que violarien el principi de causalitat, segons el qual les causes són posteriors en el temps als efectes: en un partit de tennis jugat amb taquions en compte de boles normals, si el contrari fes un moviment de retrocés en el moment de colpejar la bola-taquió, rebríem la bola-taquió restada abans d'efectuar el servei. Per això, mai no ha estat detectat cap taquió, i els físics pensen que no existeixen en la realitat.

D'altra banda, Einstein descobrí que l'energia d'un cos en repòs no és nul·la, sinó que posseeix una energia deguda a la massa, i deduí la famosa equació que expressa l'equivalència entre massa i energia: E = mc2. La massa i l'energia són, doncs, equivalents i intercanviables; són dues manifestacions de la matèria. Les lleis clàssiques de la conservació de l'energia i de la conservació de la massa són substituïdes per una única llei de conservació de la massa-energia.

La concordança entre la teoria especial de la relativitat i els experiments és completa. La teoria de la relativitat explica de manera natural l'experiment de Michelson-Morley, i concorda amb tots els fenòmens coneguts de la propagació de la llum. Els efectes relativistics han estat comprovats en nombrosos experiments en el camp de les partícules elementals, en què aquestes són accelerades a velocitats pròximes a la de la llum, i també en les observacións dels raigs còsmics, en què les partícules inestables que es produeixen en entrar aquests raigs en l'atmosfera poden arribar a la superfície terrestre, per l’efecte de la dilatació del temps, abans de desintegrar-se. D'altra banda, la relació entre massa i energia es troba en la base de tots els fenòmens relacionats amb la fusió i la fissió nuclear, fenòmens que expliquen l'origen de l'energia dels estels com el Sol i que es troben en la base de l'energia atòmica.

Tanmateix, no es pot considerar que la teoria de la relativitat haja desplaçat la mecànica clàssica. Aquesta apareix com a cas límit en les equacions de la relativitat, i és aplicable com una bona aproximació quan la velocitat relativa entre els observadors és molt petita comparada amb la velocitat de la llum. Els efectes relativístics només es fan importants quan ens acostem a la velocitat de la llum; aleshores no es poden aplicar les fórmules clàssiques, sinó les relativistes.

L'espaitemps de Minkowski

El matemàtic Hermann Minkowski, que havia estat professor d'Einstein, desenvolupà el 1908 i publicà el 1909 una formulació matemàtica de la teoria de la relativitat especial amb una descripció geomètrica en quatre dimensions. D'aquesta manera, l'espai i el temps quedaven fosos en una entitat tetradimensional, l'espaitemps. Cada punt de l'espaitemps és un succés definit, en un sistema de referència determinat per un observador inercial, per les coordenades espacials ordinaries x, y, z i el terme -ct com a quarta dimensió. El contínuum tetradimensional de l'espaitemps és comú per a tots els observadors en moviment relatiu, però per a cada observador incercial hi ha una projecció temporal unidimensional formada per tots els successos copuntuals amb l'observador, i una projecció espacial tridimensional formada, en cada moment, pels successos que són simultanis a un succés determinat. Cada projecció espacial o temporal és diferent per als diversos observadors, ja que els conceptes de copuntualitat i de simultaneïtat a distància són relatius a l'observador.

No és possible representar gràficament ni visualitzar l'espaitemps de quatre dimensions. Però és possible donar-ne una representació gràfica si eliminem una o dues de les dimensions espacials. Això és possible si suposem que el moviment en l'espai es redueix a una dimensió (o, en tot cas, a dues). Es pot representar, doncs, en un diagrama d'eixos cartesians una dimensió espacial com a eix X i la dimensió temporal ct (sense signe) com a eix Y (i, en tot cas, en perspectiva, una altra dimensió espacial com a eix Y, i en aquest cas la temporal com a eix Z). Si es trien convenientment les unitats gràfiques, es pot representar com si fos c = 1, i alsehores les unitats espacials seran representades amb una longitud igual a les temporals. Obtenim així un diagrama espai-temps o diagrama de Minkowski.

Un succés és representat, doncs, com un punt en un diagrama de Minkowski. La trajectòria d'una partícula en l'espaitemps de quatre dimensions és anomenada línia de món, i apareix en un diagrama de Minkiwski com una línia (recta si el moviment és rectilini uniforme i corba si no ho és). Són especialment interessants les línies de món dels raigs de llum, que resulten ser rectes inclinades 45º respecte als eixos. Aquestes línies delimiten els anomenats cons de llum (en la representació de l'espai amb dues dimensions en perspectiva) a partir d'un punt o succés de l'espaitemps. Una partícula real no pot moure's més ràpidament que la llum, per la qual cosa, la seua línia de món ha de romandre dins del con de llum a partir de cada punt de la trajectòria.

Els efectes relativistes, com la dilatació del temps i la contracció de la longitud, es visualitzen així com a simples projeccions o diferències de perspectiva en l'espaitemps tetradimensional degudes al moviment relatiu, en relació amb uns altres eixos que representen el nou sistema de referència. Per tant, la relativitat espacial supera els conceptes d'espai i temps absolut, però manté l'espaitemps com a ens tetradimensional absolut, respecte al qual es mesuren les acceleracions de manera absoluta.

En l'espaitemps es defineix una mètrica segons la qual tot succés és definit, com hem vist, per quatre paràmetres, tres d'espacials i un de temporal; es pot definir un interval entre dos successos anomenat també extensió, que és un invariant per a tots els observadors. L'expressió del quadrat d'aquest interval és s2 = x2 + y2 + z2 - c2t2, sent x, y, z i t els valors de les cordenades espacials i del temps per al segon succés mesurades per un observador quaalsevol, prenent els origens de cordenades espacials i de temps en el primer succés. El valor de l'interval serà igual per a tots els observadors, independentment de les mesures particulars que cadascun faça de x, y, z i t. Si observem que x2 + y2 +z2 = d2, quadrat de la distància espacial d, l'expressió del quadrat de l'interval serà s2 = d2 - c2t2.

La relació entre qualsevol parell de successos pot ser de tres tipus:

1. Si els dos successos són relacionats per un raig de llum, la distància de separació espacial serà d = ct, i per tant el valor de l'interval serà zero.

2. Si la separació espacial d és major que ct, aleshores cap raig de llum no pot unir ambdós successos; no es pot trasmetre cap informació entre l'un i l'altre i entre ambdós no pot haver-hi cap relació causal. No pot haver-hi cap sistema de referència en què ambdós successos siguen copuntuals, i, en general, observadors diferents no es posaran d'acord sobre l'ordre temporal entre els dos successos. Però sí que hi haurà un observador per al qual ambdós successos seran simultanis (per a aquest observador, t = 0), i si ds és la distància entre ambdós successos per a aquest observador, serà s = ds. Es diu que aquest parell de successos es troben separats espacialment, i el valor de l'interval és positiu i equival precisament a la distància espacial mesurada en el sistema en què ambdós successos són simultanis.

3. Si la separació espacial d és menor que ct, aleshores un raig de llum pot unir ambdós successos; es pot trasmetre informació entre l'un i l'altre i entre ambdós pot haver-hi una relació causal. No pot haver-hi cap sistema de referència en què ambdós successos siguen simultanis, i, en general, observadors diferents no es posaran d'acord sobre l'ordre espacial entre els dos successos. Però si que hi haurà un observador per al qual ambdós successos seran copuntuals (per a aquest observador, d = 0), i si tc és el temps propi entre els dos successos en aquest sistema de copuntualitat, serà precisament s = -ctc. Es diu que aquest parell de successos es troben separats temporalment, i el valor de l'interval és negatiu i equival en mòdul precisament a la distància temporal mesurada en el sistema en què ambdós successos són copuntuals, multiplicada per la velocitat de la llum.

Cal aclarir que hi ha altres maneres lleugerament diferents de definir l'interval, i de fet es defineix de diverses maneres en la literatura científica (amb eventuals canvis de signe o amb algun factor addicional). Però les conseqüències físiques de totes aquestes definicions són les mateixes.

En la pròxima entrada farem una petita introducció divulgativa a la teoria general de la relativitat, per a continuar en entrades posteriors amb algunes conseqüències d’aquesta, com els forats negres, els forats de cuc i la possibilitat de viatjar en el temps.

viernes, 15 de abril de 2011

Introducció divulgativa a la física moderna (III)

En aquesta entrada veurem alguns aspectes de la teoria especial de la relativitat d’Einstein. Per a una millor comprensió del que segueix, es recomana, a qui no hi estiga familiaritzat, rellegir l’entrada “Introducció divulgativa a la física moderna (II)”, sobretot l’apartat “Els principis de la teoria especial de la relativitat”.

La relativitat de les duracions temporals, de la simultaneïtat i de les distàncies espacials

És possible visualitzar de manera senzilla algunes de les conseqüències de la relativitat. Suposem que un vagó descobert, és a dir, sense parets ni sostre, o bé un vagó-plataforma, d'un tren viatja cap a la nostra dreta en línia recta a una velocitat uniforme pròxima a la de la llum; aquest vagó té una llargària doble que l'amplària. Quan el vagó passa per un punt determinat de la via, un focus situat en el punt mitjà del costat llarg del vagó pròxim a l'andana (o en la mateixa andana quan aquest punt del vagó passa per allí, tant se val; els raigs es desplaçarien conjuntament en els dos casos, segons el principi 1, d'unicitat dels raigs llumínics) emet un senyal lluminós (esdeveniment O), que s'estén en totes direccions com un front d'ona. Considerem primerament el raig de llum que es desplaça en un sentit perpendicular a la via; aquest raig de llum creua el vagó-plataforma de banda a banda, es reflecteix en un espill situat en l'altre costat del vagó, enfront del primer, i retorna al punt original (esdeveniment W). Aquest raig de llum recorre, en el sistema de referència del vagó, una distància igual al doble de l'amplària del vagó en sentit perpendicular a la via a una velocitat c. Però el mateix raig de llum recorre, en el sistema de referència de la via, una distància superior, ja que el tren es mou cap a la dreta respecte a la via i el raig de llum es veu obligat a seguir una trajectòria obliqua respecte a la via abans de rebotar en el mateix espill (en un punt situat en l'altre costat de la via enfront i a la dreta) i retornar, també amb una trajectòria obliqua, al punt d'arribada (situat en aquest costat de la via, però a més cap a la dreta del punt d'origen). És evident que es tracta del mateix raig de llum que l'observat des del vagó si tenim en compte la propietat 1, d'unicitat dels raigs de llum independentment del repòs o moviment de la font. Però com que la velocitat de la llum en el sistema de la via és també c segons el principi 2, de relativitat, l'única conclusió raonable és que la distància temporal (lapse de temps = espai recorregut / velocitat) entre els esdeveniments O (partida del raig de llum) i W (tornada al punt d'origen), és distinta en els sistemes de referència del tren i de la via. En el sistema de referència del tren, en què els esdeveniments O i W són copuntuals (ocorren en el mateix punt del tren: el punt mitjà d'un dels costats del vagó), la llum ha fet un recorregut igual al doble de l'amplària del vagó, i entre ambdós esdeveniments copuntuals transcorre un determinat lapse de temps anomenat duració pròpia. Però, vists des de la via, entre els esdeveniments O i W, que no són copuntuals en la via (l'esdeveniment W ocorre a una certa distància cap a la dreta de l'esdeveniment O, ja que el tren s'ha desplaçat cap a la dreta) transcorre un lapse de temps, anomenat duració impròpia, major que la duració pròpia, ja que en la via el recorregut del raig de llum, a una mateixa velocitat c, ha estat major. Així, si des del nostre sistema de referència observem un procés que es produeix lligat a un altre sistema de referència en moviment respecte al nostre, la duració d'aquest procés en el sistema de referència al qual el procés està lligat (duració pròpia) serà sempre menor que en el nostre sistema de referència, en el qual el procés no és copuntual (duració impròpia). Des del nostre sistema de referència, observem que els rellotges del sistema en moviment respecte a nosaltres funcionen més lentament que els nostres (dilatació relativista del temps). Amb una senzilla aplicació del teorema de Pitágores per a obtenir la relació entre els espais recorreguts, més la fórmula que relaciona espai, temps i veolocitat, obtindríem la relació relativista entre duració pròpia i duració impròpia, que es troba en tots els llibres de física.

Considerem ara els dos raigs de llum que es mouen, a partir de la mateixa llampada lluminosa (esdeveniment O), no perpendicularment a la via, sinó al llarg del vagó en la direcció de la via, és a dir, l’un en el sentit de moviment del tren i l’altre en sentit contrari a aquest moviment. A partir del moment O (emissió dels raigs de llum des del punt mitjà del costat llarg del vagó), parteixen dos raigs, l'un cap a la dreta, cap avant en el sentit de marxa del vagó, i l'altre cap a l'esquerra, cap arrere, en contra del sentit de marxa. El raig que viatja cap a l'esquerra a una velocitat c rebota contra un espill situat en la part posterior del vagó (esdeveniment M), i torna al punt d'origen (esdeveniment W'). El raig que viatja cap a la dreta rebota en un altre espill situat al davant del vagó (esdeveniment N), i torna també al punt d'origen (esdeveniment W''). Com que el vagó té el doble d'amplària que de llargària i els raigs han partit des del punt mitjà d'un costat, en el vagó recorren, en els seus viatges d'anada i de tornada a una velocitat c, una mateixa distància, distància que dins del tren també és igual a la recorreguda pel raig que consideràvem en el paràgraf anterior, perpendicular a la via; per tant, tots els raigs retornen, dins del vagó, al mateix temps al punt d'origen, i els esdeveniments W, W' i W'' són en realitat un mateix esdeveniment. Però el que ens interessa ara és que l'esdeveniment M (arribada del raig que va cap a l'esquerra a l'espill posterior del vagó) i N (arribada del raig que va cap a la dreta a l'espill davanter del vagó) ocorren al mateix temps en el sistema de referència del tren, ja que, en aquest sistema, ambdós raigs recorren una mateixa distància (la meitat de la llargària total del vagó) a la velocitat de la llum c; és a dir, M i N són esdeveniments simultanis en el sistema de referència del tren.

Què s'observa, però, des de la via? El tren, i per tant els espills posterior i davanter del vagó, es desplacen cap a la dreta; per tant, el raig que viatja cap a l'esquerra ha de recórrer en la via, a la velocitat c, una distància menor que en el tren per a trobar-se amb l'espill posterior del vagó; és a dir, vist des de la via el lapse temporal entre els esdeveniments O i M és menor que vist des del tren. I, de manera semblant, el raig que viatja cap a la dreta ha de recórrer en la via una distància major que en el tren per a rebotar en l'espill davanter del vagó; per tant, vist des de la via el lapse temporal entre els esdeveniments O i N és major que vist des del tren. És a dir, els esdeveniments M i N, que eren simultanis en el tren, no ho són en la via: en la via, M succeeix abans que N (relativitat de la simultaneïtat).

En realitat, el raonament clàssic ja admet que dos esdeveniments (p. ex., O i W) que són copuntuals en un sistema de referència (p. ex., en el tren) no són copuntuals en un altre sistema (p. ex., en la via). Tanmateix, aquests esdeveniments, copuntuals però no simultanis en el tren, no poden ser simultanis en cap sistema de referència, ja que cap sistema no pot viatjar més ràpid que la llum. La novetat que aporta la relativitat és que dos esdeveniments que són simultanis a distància en un sistema de referència, no ho són en un altre sistema, i com a conseqüència, tal com veurem tot seguit, la distància entre aquests esdeveniments és distinta en ambdós sistemes.

En efecte: el raig que viatja cap a l'esquerra rebota en l'espill posterior (esdeveniment M) quan la part posterior del vagó passa per un punt determinat m de la via; pel que fa al raig que viatja cap a la dreta, es troba amb l'espill davanter del vagó (esdeveniment N) quan aquest espill passa per un punt n de la via. La distància entre ambdós esdeveniments, simultanis en el tren, és igual a la llargària del vagó en el sistema de referència del tren. Si els dos esdeveniments fossen també simultanis en el sistema de la via, la distància entre els punts m i n seria la mateixa mesurada des de la via que des del tren, ja que el tren no tindria temps d’avançar entre un esdeveniment i l’altre. Però hem vist que els esdeveniments M i N no són simultanis en la via: en el sistema de la via, l'esdeveniment N és posterior a M, i ja no podem dir que el tren no ha tingut temps d’avançar; durant el lapse de temps que separa els esdeveniments M i N tot el vagó es desplaça cap a la dreta, i per tant, per als físics de la via la distància entre els esdeveniments M i N (o entre els punts m i n de la via) és major que la distància entre ambdós esdeveniments (llargària del vagó) mesurada pels físics del tren. Veiem, doncs, que la distància entre dos esdeveniments mesurada en el sistema de simultanïtat (sistema de referència del tren, en què M i N són simultanis) és menor que la distància mesurada en qualsevol altre sistema de referència.

Comparant la distància entre esdeveniments simultanis, en realitat el que fem és mesurar la llargària dels objectes materials: en l'exemple que considerem, la distància entre els esdeveniments M i N en la via és la llargària del fragment de la via que va del punt m al punt n, fragment que es troba en repòs en el sistema de la via i que pot ser mesurat pels físics de la via aplicant el mètode directe de comparació amb els patrons de longitud; aquesta és la llargària pròpia del fragment de via mn, mesurada –insistesc– en un sistema en què el fragment de la via es troba en repòs. Però per als físics del tren, en moviment respecte al fragment mn de la via, l'única manera de mesurar aquest fragment de la via des del sistema del tren és de manera indirecta, mitjançant dues observacions simultànies dels extrems del fragment, és a dir, observant que el punt m de la via se superposa amb l'espill posterior del vagó (esdeveniment M) al mateix temps que el punt n de la via coincideix amb l'espill davanter del vagó (esdeveniment M). D'aquesta manera, els físics del tren conclouran que la llargària del fragment de la via mn serà igual a la distància entre els esdeveniments M i N mesurats en del sistema del tren, és a dir, igual a la llargària del vagó mesurada també en sistema del tren. Com que aquesta distància entre els esdeveniments M i N (distància en el sistema de simultaneïtat) hem vist que és menor que la distància entre aquests esdeveniments en qualsevol altre sistema (per exemple, el de la via), els físics del tren conclouran que la llargària del fragment de la via mn, en moviment respecte a ells (llargària impròpia), és menor que la llargària pròpia del fragment, mesurada en el sistema (via) en què aquest es troba en repòs. És a dir, si mesurem, amb observacions distants simultànies, la llargària d'un cos que es troba en moviment respecte a nosaltres, obtindrem una llargària menor que si mesurem el mateix cos en repòs (contracció relativista de la longitud). Aquesta contracció afecta només les longituds mesurades en la direcció del moviment (p. ex., llargària); la mesura en les altres dues dimensions (p. ex. alçària i amplària) no és afectada.

Però, a partir d'aquestes deduccions, no hem de traure conclusions errònies. Contràriament a la hipòtesi de Fitzgerald-Lorentz, no hem de pensar que "alguna cosa succeeix als cossos, que es contrauen realment quan es troben en moviment absolut", ni que "alguna cosa succeeix als rellotges, que s'alenteixen quan es troben en moviment absolut". Segons la hipòtesi de Fitzgerald-Lorentz, els cossos es contreien materialment en la direcció del moviment absolut respecte a l'èter; és a dir, un observador que es mogués conjuntament amb el cos en moviment experimentaria directament aquesta contracció; per tant, caldria suposar que una persona que es mogués a una velocitat absoluta comparable a la de la llum podria quedar aixafada en virtut d'aquest efecte. Igualment caldria dir d'un suposat retard dels rellotges en moviment: seria erroni suposar que les persones que es mouen ràpidament respecte a un eventual èter o espai absolut viuen el temps més lentament que nosaltres. En realitat, segons la relativitat d'Einstein, la contracció de la longitud i l'alentiment del temps són efectes de les mesures efectuades per un observador de les magnituds distància i temps d'un altre observador en moviment relatiu; com que tots els observadors inercials són equivalents, l'observador en moviment no sent cap efecte especial en ell mateix, sinó que són només les mesures del temps i de l'espai dels cossos en moviment respecte a ell les que es troben afectades. Els efectes relativístics, plenament reals quan són mesurats per observadors en moviment recíproc, no són deguts al "moviment absolut" dels cossos, ja que aquest moviment absolut no existeix, sinó a l'"efecte de perspectiva" produït pel moviment relatiu.

Igualment, segons el principi de relativitat tots els observadors inercials són equivalents, i per tant, intercambiables. De la mateixa manera que els físics de la via observaran que un procés entre dos esdeveniments copuntuals en el sistema de referència del tren (per exemple, lapse entre els esdeveniments O i W, partida i arribada dels raigs de llum al punt d'origen) té una duració en el sistema del tren (duració pròpia, en el sistema en què el lapse es produeix entre dos esdeveniments copuntuals) menor que en el sistema de la via (duració impròpia, ja que en la via els dos esdeveniments que marquen el lapse no són copuntuals), els observadors del tren observaran que un procés entre dos esdeveniments copuntuals en la via té una duració pròpia menor que la duració impròpia que ells mesuren des del tren. Anàlogament, igualment que els físics del tren fan una mesura indirecta (longitud impròpia) d'un fragment de via, en moviment respecte a ells, que resulta ser menor que la longitud d'aquest mateix fragment mesurada pels físics de la via, també els físics de la via trobaran que si mesuren la llargària del vagó observant el pas simultani dels dos extrems del vagó per dos punts determinats de la via (longitud impròpia, efectuada per mesures simultànies), observaran que aquesta distància és menor que la llargària del vagó mesurada pels físics del tren (longitud pròpia, ja que el vagó es troba en repòs en el sistema del tren).

En la pròxima entrada veurem altres aspectes interessants de la relativitat especial, com la paradoxa dels bessons o del viatger de Langevin, l’equivalència entre massa i energia i l’espaitemps de Minkowski.

miércoles, 6 de abril de 2011

¡Haz tú la cuenta, tú que eres de ciencias!


Un profesor nos explicaba una vez que, si no aprendíamos a "hacer las cuentas", cualquiera podría convencernos de cualquier cosa. Y qué razón tenía.

El 'anumerismo' también es incultura”, El País, 06-04-2011

miércoles, 30 de marzo de 2011

Introducció divulgativa a la física moderna (II)

De les dues teories fonamentals de la física moderna (la relativitat i la física quàntica), començaré l’exposició per la primera, per raons històriques. A continuació, ens endinsarem en els problemes que planteja la mecànica quàntica i les seues interpretacions, sempre a nivell divulgatiu, abans d’entrar en altres temes com la física de partícules, cosmologia, etc.


LA TEORIA DE LA RELATIVITAT

Els precedents

Durant el segle XVII, Galileu i Newton havien posat les bases de la física i de la ciència en general. A partir de les tres lleis del moviment de Newton, de la llei de la gravitació universal, deduïda també per Newton, i dels conceptes newtonians d'espai i temps absoluts, s'havia desenvolupat durant els dos segles següents un cos teòric impressionant, que permetia explicar els moviments dels cossos macroscòpics, des de la caiguda d'una poma i el moviment d'una pilota en el camp gravitatori terrestre fins al moviment dels planetes i altres cossos celestes. D'altra banda, a mitjan segle XIX, James Clerk Maxwell, culminant el treball d'altres físics com Gauss, Ampère, Faraday, etc., havia formulat les lleis del camp electromagnètic, que permetien explicar els fenòmens de l'electricitat i el magnetisme i predeien les ones electromagnètiques, de les quals la llum i les ones de ràdio són una manifestació. L'òptica quedava inclosa, doncs, com una branca de l'electromagnetisme clàssic. A més a més, durant el segle XIX s'havien desenvolupat la termodinàmica, la teoria cinètica dels gasos i la mecànica estadística, que explicaven i relacionaven fenòmens i conceptes com la calor, la temperatura, la pressió, l'energia i l'entropia, i s'havien posat les bases per a la teoria atòmica de la matèria. Tot aquest cos de coneixement, que havia permès la primera revolució industrial i semblava que podia donar una explicació global de tots els fenòmens naturals, s'anomena física clàssica.

Tanmateix, al final del segle XIX s'evidenciaren alguns problemes. En principi, conceptes com ara posició, velocitat, acceleració, etc. implicaven la idea d'un observador o sistema de referència, respecte al qual s'han de mesurar aquests valors. Entre tots els sistemes de referència possibles, les lleis de Newton eren aplicables directament en els sistemes no accelerats, és a dir, entre els que es mouen entre si i respecte a l'espai absolut newtonià amb moviment rectilini uniforme, és a dir, amb velocitat constant i sense rotació; eren els anomenats sistemes de referència inercials. Només en els sistemes de referència inercials es compleixen les lleis del moviment de Newton; és a dir, només en aquests sistemes un cos no sotmès a cap força es mou en línia recta i amb velocitat constant, i, si es sotmès a una força, experimenta una acceleració inversament proporcional a la seua massa inercial. En altres sistemes de referència no inercials, és a dir, accelerats o en rotació, no es compleixen les lleis de Newton; per a descriure els moviments en aquests sistemes, cal introduir les anomenades forces fictícies o d'inèrcia, com ara la força centrífuga en un sistema en rotació o la força de Coriolis. Precisament, com que hom no pot mesurar el moviment d'un sistema de referència respecte a un eventual espai absolut, l'únic test vàlid per a determinar si un sistema de referència és inercial o no és verificar si s'hi compleixen les lleis de Newton. Respecte a les lleis de Newton i a les restants lleis de la mecànica que se'n deriven, els infinits sistemes de referència inercial són equivalents; en tots es compleixen aquestes lleis i hom no pot distingir, mitjançant experiments de mecànica, si es troba en repòs o en moviment respecte a l'espai absolut; és el que després es coneixeria com a principi de relativitat restringida o de Galileu.

Però les equacions de Maxwell de l'electromagnetisme contenien de manera implícita la velocitat de la llum, i no quedava clar respecte a quin sistema de referència calia mesurar aquesta velocitat; si es considerava que la velocitat de la llum que es derivava de les equacions de Maxwell era la velocitat de la llum respecte a l'espai absolut, les equacions prenien una forma complicada quan hom canviava de sistema de referència. Això vol dir que les equacions de Maxwell no són invariants en una transformació de Galileu, és a dir, en un canvi entre sistemes de referència relacionats a la manera clàssica. Hi havia, doncs, un sistema de referència, el de l'espai absolut, privilegiat per a les lleis de l'electromagnetisme, en oberta contradicció amb el que s'esdevenia amb les lleis de la mecànica, invariants per a tots els observadors inercials.

D'altra banda, la teoria ondulatòria de la llum, que explicava tots els fenòmens òptics coneguts fins aleshores, s'imposà durant els segles XVIII i XIX, i era coherent amb la concepció de la llum com a ona electromagnètica, que es deduïa de les lleis de Maxwell. Però la transmissió mecànica d'una ona exigia l'existència d'un medi transmissor. Per a pal·liar aquests problemes, hom proposà la idea de l'existència d'un mitjà anomenat èter, amb unes propietats extravagants, que servís de mitjà de transmissió de la llum i de les ones electromagnètiques en general. A més a més, aquest èter era una espècie de materialització de l'espai absolut de Newton, respecte al qual calia mesurar la velocitat de la llum.

Però si l'èter i l'espai absolut existien, havia de ser possible mesurar la velocitat dels cossos, i concretament de la Terra, respecte a aquest èter immòbil; això no era possible mitjançant experiments de mecànica (principi de relativitat de Galileu), però sí que havia de ser possible mitjançant experiments d'òptica: si la llum es movia a través de l'èter amb una velocitat absoluta, havia de ser possible apreciar diferències en la velocitat dels distints raigs de llum respecte a la Terra segons es moguessen en la mateixa direcció o en direcció contrària o perpendicular al moviment de la Terra, i segons de la velocitat d'aquesta. El 1881 i 1887, Michelson (premi Nobel de física el 1907) realitzà, primerament en solitari i després en col·laboració amb Morley, una sèrie d'experiments, amb una tècnica d'interferometria òptica molt precisa, per a mesurar la velocitat absoluta de la Terra en diferents èpoques de l'any. Els experiments de Michelson-Morley donaven, però, un resultat sorprenent i aparentment absurd: no es pogueren mesurar diferències de velocitat entre els raigs de llum en direccions diverses, i per tant la velocitat de la Terra respecte a l'èter semblava que era exactament nul·la. El majestuós edifici de la física clàssica començava a mostrar greus esquerdes; la física es trobava, al començament del segle XX, en un atzucac.

La major part dels físics ignoraren els experiments de Michelson-Morley, però alguns tractaren de proposar algunes hipòtesis que expliquessen el resultat de Michelson-Morley dins del paradigma clàssic. Hom proposà que l'èter podia ser "arrossegat" per la Terra en el seu moviment; però aquesta idea de l'èter arrossegat era contradictòria amb fets experimentals ben coneguts, com ara l'aberració de la llum estel·lar o el fet que la velocitat de la llum era independent de l'estat de repòs o moviment de la font lluminosa emissora, fets coherents amb la teoria ondulatòria de la llum. Fitzgerald i Lorentz, per explicar l'experiment de Michelson-Morley, arribaren a suposar que els cossos es contreien materialment dins de l'espai absolut en el sentit del moviment; aquest estrany fenomen explicava l'experiment de Michelson-Morley, però era contradictori amb altres experiments; a més a més, ningú no era capaç d'explicar com es produïa aquesta contracció independentment de les propietats físiques dels cossos. El 1904, Lorentz arribà a proposar sense demostració unes relacions, conegudes com a transformació de Lorentz, que relacionaven les mesures de longitud en funció de la velocitat de sistemes mòbils i fixos, de manera que fossen compatibles amb les equacions de Maxwell; per donar coherència a la seua teoria sobre l'electricitat, Lorentz suggerí també que els cossos en moviment respecte a l'èter experimentaven realment, a més a més de la contracció de la longitud, un alentiment del temps local i un augment de la massa d'origen electromagnètic quantitativament iguals als de la relativitat, però amb una interpretació física diferent. Henri Poincaré, l'any 1904, proposà de manera qualitativa un principi de relativitat semblant al d'Einstein, i albirà de manera intuïtiva la necessitat d'una nova mecànica en què «la velocitat de la llum es convertiria en un límit infranquejable». Es trobaven en l'ambient algunes peces soltes que trobarien coherència en la nova teoria d'Einstein.

Els principis de la teoria especial de la relativitat

El 1905, Albert Einstein, un modest funcionari d'una oficina de patents a Berna, va publicar en la revisa Annalen der Physik tres articles d'una importància excepcional en la història de la ciència. En el primer article, pel qual rebria el premi Nobel l'any 1921, explicava l'efecte fotoelèctric, introduïa el concepte dels fotons com a quàntums o partícules de la radiació electromagnètica i posava les bases per a la teoria quàntica de la llum. El segon article tractava dels aspectes estadístics de la teoria molecular, incloïa una anàlisi matemàtica detallada del moviment brownià (moviment caòtic de les partícules en suspensió, quan són colpejades per les molècules d'un fluid) i donava proves concloents a favor de la teoria atòmica de la matèria, aleshores encara en discussió. En el tercer article, titulat modestament «Sobre l'electrodinàmica dels cossos en moviment», Einstein exposà la teoria especial de la relativitat, que seria completada amb un article posterior el mateix any.

Einsten pretenia resoldre la contradicció existent entre les equacions de Maxwell per al camp electromagnètic i la mecànica newtoniana. Parteix d'unes poques i senzilles hipòtesis:

1. Principi de constància de la velocitat de la llum o d'unicitat dels raigs lumínics: la velocitat de la llum en el buit respecte a un sistema inercial és constant i igual a c, independentment de l'estat de repòs o moviment de la font emissora: és a dir, dos raigs lumínics emesos respectivament per una font en repòs i per una font en moviment respecte a un sistema inercial es mouen conjuntament com si es tractés d'un únic raig de llum. Aquesta propietat de la llum era coherent amb les lleis de l'electromagnetisme de Maxwell i va ser comprovada experimentalment l'any 1913 per de De Sitter mitjançant l'observació dels sistemes d'estels dobles.

2. Principi de relativitat: les lleis de la física són vàlides per a tots els sistemes inercials. En particular, hi és vàlid el principi de constància de la velocitat de la llum: la velocitat de la llum mesurada en qualsevol sistema inercial és constant i igual a c. És a dir, tots els sistemes inercials són equivalents, no sols per a les lleis de la mecànica, com ja establia la relativitat restringida de Galileu, sinó per a qualsevol de les lleis de la física; cap observador que es trobe en un sistema inercial (que es mou en línia recta sense acceleració) no pot definir una velocitat absoluta per al seu sistema. Aquest principi és conseqüent amb l'experiment de Michelson-Morley.

3. Homogeneïtat i isotropia de l'espai i homogeneïtat del temps. És a dir, les lleis de la física són independents del lloc i de la direcció elegida en l'espai, i del moment temporal escollit per a realitzar els experiments. Una suposició prou raonable, contrastada per l'experiència.

Observem que el principi 1 és congruent amb la consideració de la llum com a ona que es desplaça en un medi, i aquesta propietat la compleix també, per exemple, el so, quan es desplaça en l'aire: la velocitat del so en l'aire és independent del fet que la font sonora estiga en repòs o en moviment respecte a l'aire; les ones sonores tenen una velocitat fixa en l'aire que les transmet, i respecte a un observador fix en la Terra, aquesta velocitat és la mateixa tant si la font sonora es troba en repòs com si és troba en moviment. La diferència entre el comportament de les ones sonores i el de la llum és que la velocitat de les ones sonores respecte al sistema mòbil lligat a la font emissora, encara que siga un sistema inercial, serà diferent que respecte a l'aire en repòs; en canvi, en el cas de la llum, la velocitat d'un raig lluminós seria la mateixa tant respecte al sistema en moviment com respecte al sistema en repòs. No és que les ones sonores no complesquen el principi de relativitat: si l'aire és arrossegat en l'interior d'un vagó de tren tancat i aquest és un sistema inercial, la velocitat de les ones sonores respecte al tren en l'interior d'aquest serà la mateixa que la velocitat del so mesurada en l'aire en repòs, i diferent de la velocitat respecte al tren de les ones exteriors; les ones del interior del tren avançaran respecte a les ones transmeses per l'aire exterior en repòs, cosa que no succeirà en el cas de la llum.

El principi 2 ja era considerat vàlid per a les lleis de la mecànica (principi de relativitat restringida o de Galileu). Per exemple, un projectil disparat per un mateix canó adquirirà la mateixa velocitat respecte al sistema del canó independentment del moviment del canó si aquest moviment és rectilini i uniforme. Tanmateix, el projectil no compleix el principi 1: si el canó ens dispara allunyant-se de nosaltres, la velocitat de la bala respecte a nosaltres serà menor que si el canó es troba en repòs, però la velocidad del projectil serà major si el canó s'acosta a nosaltres.

L'assumpció d'ambdues propietats per part de la llum dóna lloc a una contradicció aparent. Suposem que ens trobem aturats en una via, i que un tren en moviment s'allunya de nosaltres a una velocitat constant v; nosaltres, aturats en la via, llancem un raig de llum R1 en la direcció del moviment i en el sentit d'avanç del tren, és a dir, allunyant-se també de nosaltres, mentre una altra persona, pujada al tren i en moviment solidari amb aquest, llança, també cap avant, un segon raig de llum R2. Si acceptem el principi 2 (principi de relativitat), el raig R1, llançat per nosaltres des de la via, es mourà a una velocitat c respecte a nosaltres, i el raig R2, llançat per la persona del tren, viajarà igualment a una velocitat c respecte al tren; però aleshores, si apliquem la fórmula clàssica de suma de velocitats coneguda com a "transformació de Galileu", la velocitat de R2 respecte a nosaltres serà de c+v. Però ací entrem en contradicció amb el principi 1 (unicitat dels raigs lumínics), ja que l’aplicació de la suma de velocitats o transformació de Galileu ens dóna com a resultat que el raig R1, llançat per nosaltres, en repòs en la via, viatja a velocitat c, mentre que el raig R2, llançat per la persona del tren en moviment, hauria de viatjar a velocitat c+v; en canvi el principi 1 ens afirmava que els dos raigs lumínics viatgen conjuntament a velocitat c independentment que l’hagem llançat nosaltres (font en repòs) o des del tren (font en moviment). Suposem ara que desitgem mantenir com a cert el principi 1 (unicitat dels raigs lumínics); aleshores, per a nosaltres, tant R1 (llançat per la font en repòs) com R2 (font en moviment) viatgen a la mateixa velocitat c; però aleshores per a l'observador del tren, que persegueix el raig R2, aquest raig viatjarà a una velocitat c-v, en contradicció amb el principi 2 (principi de relativitat).

L'aportació revolucionària d'Einstein fou el descobriment que aquesta contradicció era deguda als supòsits implícits en la transformació de Galileu, és a dir, als conceptes newtonians d'espai i temps absolut; en sumar les velocitats segons la fórmula clàssica, hom presuposa que la mesura del temps i de les distàncies és idèntica per a ambdós observadors en moviment relatiu, la qual cosa resulta ser falsa. Deixant de banda els conceptes d'espai i temps absolut, i superant la idea de l'èter, que es torna innecessari, a partir de les hipòtesis de la relativitat Einstein deduí teòricament les equacions de transformació de Lorentz, que relacionen les mesures de les magnituds físiques entre sistemes de referència en moviment deixant invariants les equacions de Maxwell, i deduí també les relacions de transformació per a la velocitat, compatibles amb la constància de la velocitat de la llum, i les relacions de transformació per a les altres magnituds físiques. A partir d'aquestes equacions, deduí conseqüències que desafiaven el sentit comú: la relativitat de la simultaneïtat, el retard dels rellotges i la contracció dels objectes d'un sistema en moviment, observats des d'un altre sistema de referència respecte al qual es mou el primer sistema.

En la pròxima entrada veurem les conseqüències de la relativitat especial i els seus efectes sobre la mesura del temps, de l’espai i de la massa, i a més introduïrem l’espaitemps a partir de la formulació de Minkowski.

martes, 22 de marzo de 2011

Definició de magnituds en física


En los libros elementales de física se suele decir que las magnitudes fundamentales son longitud, tiempo y masa, a las que se suele añadir la carga eléctrica y quizá otras menos usadas. Sin embargo, como veréis, la cosa no es tan sencilla. He revisado el material que he encontrado sobre el tema y he intentado sacar mis propias conclusiones, que me gustaría contrastar con otras personas interesadas. Mantengo el texto en la lengua en que fue redactado (catalán, variante valenciana); pero si alguien está muy interesado y tiene dificultades de comprensión puede ponerse en contacto conmigo.

Una vegada acceptades com a fonamentals les magnituds longitud i temps, i fixat un sistema de referència, queda definida la posició de la partícula material respecte al dit sistema. A continuació, definim, com es fa habitualment, la velocitat v i l’acceleració a com a derivades primera i segona del vector de posició.

Però per a donar un pas més i definir la massa i la força, cal adoptar algunes precaucions. En primer lloc, cal distingir entre massa inercial (la magnitud que apareix en les lleis de Newton) i massa gravitacional (la que apareix en la llei de la gravitació universal, també de Newton).

En els textos de física se sol definir la massa inercial com una propietat dels cossos en llur interacció mútua. Coneguda la massa del cos patró (mP) fixat com a unitat de massa, la massa de qualsevol altre cos de prova es pot determinar segons l'equació:

                            m = - mPaP/a                          (1)

on a i aP són, respectivament, les acceleracions lineals del cos incògnita i del cos patró quan aquests interaccionen.

         Cal plantejar-se en quin sistema es mesuren les acceleracions de (1). Aquesta equació només és aplicable si mesurem les acceleracions en el sistema centre de masses (CM), on la quantitat del moviment total del sistema és, per definició, zero, o bé en un sistema inercial. Però no podem aplicar directament l’equació en el sistema CM, ja que la definició del CM requereix la determinació prèvia de la massa m, que és el que volem calcular. Aquestes acceleracions s'han de mesurar, doncs, en un sistema inercial, que es defineix com un sistema vinculat a un cos no subjecte a interaccions amb altres cossos, i els eixos del qual no giren; en aquest sistema, l'equació (1) és conseqüència directa de la tercera llei de Newton, però podem prendre-la com a definició de massa inercial.

         Observem que si intentem mesurar la relació de masses en un sistema no inercial, hi apareixeran les acceleracions d'inèrcia aI, de manera que les acceleracions observades de cada partícula seran aP' = aP - aI per al cos patró, i a' = a - aI per al cos de prova. Per tant, si intentem aplicar (1) amb la relació d'acceleracions en un sistema no inercial obtindrem, per a la partícula de prova, una massa m' = - mPaP'/a' = - mP (aP - aI) / a - aI), diferent de l'obtinguda en el sistema inercial. Per tant, per a una correcta definició de la massa necessitem prèviament una definició de sistema inercial.    

         La definició de massa (1) es basa en l'observació que la quantitat m/mP és una constant per a cada parell de cossos, o bé per a tot cos si considerem ja fixada la massa unitat mp. Aquesta propietat es pot derivar com a conseqüència del principi de conservació de la quantitat de moviment. Efectivament, si definim el vector quantitat de moviment p com a p = mv, aquest principi s'expressarà, per a moviment rectilini, com a mv + mPvP = constant, i derivant aquesta expressió obtindrem (1).

            Definida així la massa, la segona llei de Newton, en un sistema inercial (suposant que la massa és constant)

                            F = ma                                    (2)

sol considerar-se en molts textos no com una llei de la naturalesa, sinó com una definició de força (Finn-Alonso, Tipler). El descobriment de Newton comportaria, doncs, que aquest concepte expressa d'una manera coherent la interacció entre cossos.

            Segons aquest programa, la primera llei de Newton seria una conseqüència de la definició de força, mentre que la tercera seria una conseqüència del principi de conservació de la quantitat de moviment.

D'aquesta manera, les lleis de la gravitació, de l'electromagnetisme, etc., són veritables lleis de la naturalesa, que expressen la mesura de les interaccions quantificades sota el concepte de força. Per exemple, en la llei de la gravitació de Newton:

                            FG = GmGMG/r2 = mGg                       (3)

hi apareix la quantitat mG (massa gravitacional). La proporcionalitat entre massa inercial i massa gravitacional (igualtat amb una adequada elecció d'unitats: mG = m) apareixeria com una altra llei de la naturalesa, que es pot deduir, però, del principi d'equivalència de la relativitat general. Aquesta igualtat ens permet, quan la interacció és, per exemple, entre la Terra i un cos pesant, fer mGg = ma, d'on g = a; és a dir, en deduïm que tots els cossos cauen amb la mateixa acceleració g = GM/r2 (on M és la massa de la Terra), i podem avaluar la massa dels cossos comparant els pesos respectius.

         El programa establert, que procedeix de Mach, té, però, algunes dificultats. En primer lloc, l'equació (1) no és suficientment general. No és aplicable a cossos no accelerats. A més, com que és equivalent a la tercera llei de Newton, només és aplicable en el cas d'interaccions instantànies, ja que, tot i que és conseqüència de la llei de conservació de la quantitat de moviment, no té en compte la quantitat de moviment que es desplaça entre les partícules en interacció quan la interacció no és o no pot considerar-se instantània. Segons Mario Bunge, l'equació (1) no pot considerar-se una definició, sinó un procediment per a mesurar la massa en un cas particular. La massa (inercial, en aquest cas) és una propietat objectiva de les partícules, independentment de la manera com es puga mesurar o del fet que aquestes partícules estiguen accelerades o no. D'altra banda, una definició de la força a partir de l'equació (2) només ens donaria la força total que actua sobre una partícula, i no ens informaria sobre cadascuna de les forces particulars resultat de la interacció amb cossos diversos. Aquesta definició no tindria sentit, per exemple, en estàtica, on l'acceleració d'una partícula en equilibri és nul·la, tot i que hi actuen forces diverses que s'anul·len.

         Però, a més, igualment que la llei de conservació de la quantitat de moviment, l'equació (1) només és aplicable, com ja hem dit, si mesurem les acceleracions en el sistema centre de masses (on la quantitat del moviment total del sistema és, per definició, zero), o bé en un sistema inercial. Aleshores topem amb la dificultat d'establir una definició prèvia correcta de sistema inercial. La definició que hem donat d'un sistema inercial, com "un sistema vinculat a un cos no subjecte a interaccions amb altres cossos" inclou el concepte d'interacció, matemàticament expressat com una força. Per tant, si es defineix la força mitjançant l'equació (2), ens trobem amb una situació circular: no podem definir la força mitjançant l'equació (2), que es dóna per a sistemes inercials, perquè prèviament ha intervingut el concepte de força (interacció) en la definició de sistema inercial, com a sistema lliure d'interaccions.

         Hi hauria, encara, una altra possibilitat: la de definir els sistemes inercials en funció de la radiació de fons de microones que ompli l’univers. Per exemple, seria un sistema inercial aquell en què la radiació de fons de microones és isòtropa, i també tots els sistemes que es mouen amb moviment rectilini i uniforme respecte a aquest; o bé, seria inercial un sistema en el qual la radiació de fons té una anisotropia constant. Amb aquesta definició, podríem considerar de nou la segona llei de Newton com a definició de força. Tanmateix, aquesta alternativa no faria justícia a la realitat històrica del descobriment de Newton ni al concepte original de sistemes inercials, ni tampoc se superarien les dificultats indicades en els paràgrafs anteriors. Resulta, doncs, preferible, definir els sistemes inercials com han estat definits històricament, deduir la isotropia de la radiació de fons en els sistemes inercials com a conseqüència de les altres lleis de la física o del principi d’isotropia de l’espai, i buscar una definició o caracterització alternativa de força.

         Tampoc no serveix l'alternativa de considerar la força com a magnitud primitiva i intentar definir la massa per l'equació (2). Igualment que en el programa de Mach, aquesta equació no es pot aplicar a cossos no accelerats, als quals, si l’equació fos una definició, no hi hauria possibilitat d'assignar-los una massa. La massa inercial és una propietat dels cossos que es manifesta com a resistència a la variació de la velocitat en qualsevol mena d'interaccions; és per tant, un concepte primitiu que no deriva del concepte de força.

         Qualsevol intent, doncs, de definir la força o la massa l’una a partir de l'altra segons la segona llei de Newton comporta dificultats, i amaga el fet que cada partícula experimenta acceleracions proporcionals a la força (o forces) que s'hi apliquen, i que una mateixa força origina acceleracions inversament proporcionals a la massa de les partícules a què s'aplica.

         Tot això ha portat alguns autors (Bunge, Symon, Alemañ et al.) a considerar el concepte de força com a primitiu, en el sentit d'expressió matemàtica d'una interacció, juntament amb el concepte també primitiu de massa inercial, com a propietat escalar de les partícules. Segons això, la segona llei de Newton seria una veritable llei de la naturalesa que expressa una relació entre magnituds primitives, concretament, el fet que, en els sistemes inercials, definides la massa i l'acceleració de manera prèvia, la mateixa força provoca acceleracions inversament proporcionals a les masses inercials dels cossos de prova. La primera llei de Newton, en canvi, seria una conseqüència de la segona, i la tercera llei, una conseqüència del principi de conservació de la quantitat de moviment, més fonamental y general que la mateixa tercera llei.

         Observem que la validesa de la segona llei de Newton i la caracterització d’aquesta com a llei de la naturalesa queda incòlume també en la teoria de la relativitat, si l’escrivim en la seua forma més general: F = dp/dt, on el vector p és ara la quantitat de moviment relativista, definit de manera convenient perquè es complisca la llei de conservació de la quantitat de moviment.

Pel que fa a la definició dels sistemes inercials, continua sent vàlida la donada inicialment (un sistema vinculat a un cos no subjecte a interaccions amb altres cossos, i els eixos del qual no giren); el fet que siguen també inercials tots aquells sistemes els orígens de coordenades dels quals es desplacen a velocitat relativa constant respecte a un d’inercial i els eixos dels quals no giren, es pot deduir del principi de relativitat restringida o de Galileu, segons el qual les lleis de la mecànica (concretament, les lleis de Newton), són invariants en tots els sistemes inercials. Però davant la dificultat de comprovar a priori si una partícula es troba lliure d'interaccions o no, es considerarien empíricament com a sistemes inercials aquells sistemes en què es compleixen les lleis de Newton; en canvi, en els sistemes no inercials, per a conservar formalment l'equació (2) caldria introduir en el càlcul les forces fictícies, que no serien veritables forces en el sentit que no serien expressió de la interacció entre cossos.

         Observem que les lleis de les forces, com ja hem dit, són també vertaderes lleis de la natura. P. ex., la llei de la gravitació expressa el fet que la força entre dos cossos és proporcional a llurs masses gravitacionals i inversament proporcional al quadrat de la distància que els separa; la llei de Coulomb expressa el fet que la força elèctrica és proporcional a les càrregues i també inversament proporcional al quadrat de la distància, etc.

         D. Hestenes distingeix entre dues classes de definicions: definicions explícites i implícites. Un concepte és definit explícitament quan és expressat en termes d'altres conceptes; p. ex., l'energia cinètica, que es defineix com a K = mv2/2. Un concepte o terme és definit implícitament per una sèrie d'axiomes que el relacionen amb altres conceptes; per exemple, el punt és definit pels axiomes de la geometria, que el relacionen amb altres conceptes com recta, pla..., i un vector és definit pels axiomes de l'espai vectorial que indiquen com sumar vectors o multiplicar vectors per un escalar. Comunament es diu que termes com punt o vector, introduïts per axiomes, són termes no definits, però segons l'autor aquesta és una expressió desafortunada que ha de ser rebutjada. Més que dir que "alguns termes de la teoria han de ser no-definits”, caldria dir que "alguns termes d'una teoria han de ser definits implícitament". Des d’aquest punt de vista, la força és definida implícitament per les lleis de les forces (entre les quals, podem triar-ne una per a la definició; per exemple, la de la gravitació universal), de la mateixa manera que la massa inercial és definida implícitament per la segona llei de Newton.

         Tindríem, doncs, el següent esquema simplificat d’axiomatització per a la mecànica clàssica de partícules:
 - Magnituds primitives (que poden caracteritzar-se, però no definir-se, v. Alemañ et al., o bé poden definir-se només implícitament): longitud, temps, massa inercial, massa gravitacional, força, càrrega elèctrica...
- Magnituds i conceptes derivats: velocitat, acceleració, quantitat de moviment, moment angular, treball, energia, sistema inercial...
- Lleis primitives (axiomes): segona llei de Newton, lleis de les forces (llei de la gravitació, lleis de l'electromagnetisme de Maxwell, etc.), conservació de la quantitat de moviment, conservació del moment angular, principi de relativitat d’Einstein (totes les lleis de la física, i no únicament les de la mecànica, són invariants per a tots els sistemes inercials), principi d'equivalència (entre un sistema accelerat i un sistema sotmés a gravitació), isotropia de l’espaitemps...
- Lleis derivades (teoremes): primera i tercera llei de Newton, proporcionalitat entre massa inercial i massa gravitacional, caiguda de tots els cossos amb la mateixa acceleració, isotropia de la radiació de fons...

         El programa de caracteritzacions i definicions de la nostra axiomatització seria el següent (aquesta axiomatització no pretén ser completa, sinó que tan sols vol destacar el caràcter de conceptes primitius i independents de massa inercial, massa gravitacional i força):

Longitud, temps

         Magnituds primitives, a partir de les quals triem un sistema de referència. En mecánica clàssica, t és independent del sistema de referència, mentre que en mecànica relativista sí que en depèn.

Força

         Magnitud primitiva, expressió matemàtica de la interacció entre cossos.

Massa inercial

         Magnitud primitiva. Com hem descrit, és l’escalar que expressa una propietat de la partícula que caracteritza la inèrcia o resistència al canvi de velocitat i es pot mesurar en alguns casos per mitjà de l'equació (1).

Massa gravitacional

         Magnitud primitiva. Es una altra propietat escalar de les partícules, que intervé en la llei de gravitació. La proporcionalitat (o igualtat, si es tria adequadament el sistema d'unitats) entre massa inercial i massa gravitacional és una conseqüència del principi d'equivalència. Observem que igualment podríem triar com a llei primitiva la igualtat de les masses inercial i gravitacional, i deduir-ne com a teorema el principi d’equivalència.

Sistema inercial

         Concepte derivat. Es defineix com aquell que té l'origen en una partícula no sotmesa a forces i els eixos del qual no giren respecte a l'univers (respecte als estels fixos, de Newton).

Lleis de Newton del moviment

         Lleis que descriuen la manera de moure's una partícula sotmesa a determinades forces, en un sistema inercial. La segona llei de Newton (F = dp/dt) és una llei primitiva, juntament amb la conservació de la quantitat de moviment. La primera i la tercera són teoremes.

Lleis de les forces

         Les lleis de les forces (de la gravitació, de Coulomb, etc.) són lleis primitives la naturalesa.

Sistemes d'unitats

         La unitat de longitud i de temps (metre i segon), es defineixen com es fa habitualment en els textos. La unitat de massa inercial es defineix com la massa inercial del quilo patró.

Per a definir la unitat de força, atés que hem definit aquesta com a mesura d’una interacció, caldria partir d'alguna de les lleis de les forces. Per exemple, a partir la llei de la gravitació universal, podríem definir la unitat de força com l'equivalent a 1/k multiplicat per la força a què es veuen sotmeses dues masses d'un quilogram separades per un metre de distància, de manera que k podria elegir-se lliurement. En aquest sistema, la llei de la gravitació universal s’expressaria com a F = kmGMG/r2 (on mG i MG serien les masses gravitacionals dels cossos). Fent, arbitràriament, k = 1, quedaria F = mGMG/r2.

En aquest sistema, la segona llei de Newton del moviment ens diria que l’acceleració que experimenta un cos es proporcional a la força resultant a què és sotmés; és a dir, F = k’ma (on m es la massa inercial del cos). Sabent que, segons les lleis de la física, la massa gravitacional és proporcional a la massa inercial, podem triar el sistema d’unitats de manera que la massa inercial i la massa gravitacional siguen numèricament iguals, és a dir, mG = m. Aleshores, un cos o partícula de massa m sotmés a l’atracció terrestre estaria sotmés a una força F = mM/r2 (on M és ara la massa de la Terra), i experimentaria una acceleració igual a g = F/k’m. Com que el valor de g podríem mesurar-lo de manera independent (per exemple, per mitjà d’un pèndol), podríem calcular experimentalment el valor de k’.

Històricament, es va procedir a l’inrevés. En el Sistema Internacional d’unitats, el valor de k’ es igual a 1. Per això, la segona llei de Newton pren la forma F = ma. Newton va formular la llei de gravitació amb la fórmula coneguda F = GmM/r2; però la igualtat entre massa inercial i massa gravitacional que aquesta formulació implicava només es va comprendre completament amb la formulació del principi d’equivalència dins de la teoria general de la relativitat d’Einstein. Només calia mesurar experimentalment el valor de la constant G, fet que va portar a terme poc més tard Cavendish.

Però siga quin siga la definició de les unitats o el sistema d'unitats triat, observem que força, massa inercial i massa gravitacional són magnituds independents. En el SI, atés que la segona llei de Newton pren la forma F = ma, podem definir la unitat de força (el newton) com la força que, aplicada a un objecte de massa 1 kg li produeix una acceleració d'1 m/s2. Però aquesta definició depén del sistema d'unitats triat, i no és obstacle perquè força i massa s'hagen de definir conceptualment de manera independent.

         Trobem una situació és similar en la definició de la unitat de càrrega en el sistema cgs. En aquest sistema, la llei de Coulomb s'expressa com a F = qQ/r2, i la unitat de càrrega es defineix com a unitat derivada, en funció de les unitats de massa, longitud i temps. Això no impedeix que la càrrega puga ser considerada una magnitud conceptualment fonamental, per exemple, en el sistema MKSQ. També la unitat de massa podria definir-se com una unitat derivada, si partíssem de F = Mm/r2 (amb la constant igual a 1), en termes de longitud i temps, en contrast amb la seua conceptualització habitual com a magnitud primitiva.

         Cal distingir, doncs, entre dues dicotomies diferents. D'una banda, magnituds primitives (conceptualment independents) i derivades (definibles a partir d'aquestes), i d'una altra, unitats fonamentals (definides només a partir d’elements de la realitat, com el metre i el quilogram) i derivades (definibles a partir de les unitats fonamentals). La primera dicotomia depén de l'estructura de les lleis de la física, mentre que la segona depén només del sistema d'unitats triat. Així, la massa gravitacional i la força poden considerar-se magnituds primitives, però tenen unitats derivades en el sistema SI (1 newton és igual a 1 quilogram per un metre dividit per un segon al quadrat, mentre que el quilogram com a unitat de massa gravitacional és igual al quilogram com a unitat de massa inercial). La càrrega, magnitud primitiva, té unitats derivades en els sistemes cgs i SI (MKSA, on 1 coulomb és igual a un ampere per un segon), i només és unitat fonamental en el sistema MKSQ.

         El fet que ens permet definir les unitats de massa gravitacional, de força i de càrrega com a derivades, tot i considerar-se magnituds primitives, és que hi ha lleis generals que les relacionen amb unitats fonamentals: F = ma, mG = m, q = It. En canvi, el metre i el segon són considerades unitats fonamentals (en tots els sistemes d'unitats) perquè no hi ha cap llei general que les relacione, sinó tan sols una propietat particular d'algun ens material (en aquest cas, la llum).


BIBLIOGRAFIA CITADA (no done algunes de les referències completes pel caràcter informal d’aquest escrit, i per ser suficientment conegudes pels estudiants i professionals de la física)

- Manuals usuals de física general (Finn-Alonso, Halliday i Resnick, Tipler, etc.).
- Symon, Mecánica, p. 11.
- Bunge, M. Controversias en física, cap. 1.
- Alemañ Belenguer, Rafael Andrés, et al.: “La axiomatización en la enseñanza secundaria: una opción didáctica”, Enseñanza de las Ciencias (Barcelona), 1999, 17 (2), p. 343-349.
- Hestenes, D.: “Foundations of Mechanics”, en New Foundations for Classical Mechanics, 1986 (http://ckw.phys.ncku.edu.tw/public/pub/Notes/Mathematics/Geometry/Hestenes/NFCM/Main.html).