Thomas Kuhn and Hilary Putnam. “Cut the pie any way you like, ‘meanings’ just ain’t in the head!”

This post is in memory of Prof. Hilary Putnam who died 4 days ago at the age of 89.

Thomas Kuhn’s first edition book, Structure of Scientific Revolutions is a very famous book, and it has caused quite a stir among philosophers of science since its first publication in 1962. Kuhn introduced the idea of a paradigm; a paradigm governs, in the first instance, not a subject matter but rather a group of practitioners. What do members of an isolated community of specialists share that accounts for the relative fullness of their professional communication and the relative unanimity of their professional judgment? To that question, the 1962 Structure licenses the answer, a paradigm or set of paradigms. Scientists would say they share a theory or set of theories.

However, there seemed to be philosophical problems with several themes and concepts in Kuhn’s 1962 work, especially with the “incommensurability thesis”. The thesis of incommensurability of scientific theories is such a controversial thesis in the philosophy of science and it has been criticized and challenged by many philosophers of science since 1962 (the year Kuhn had presented it). The initially heated debate about the concept of a paradigm has considerably cooled down because already in the postscript to the second edition of the Structure Kuhn suggested corrections to his original concept.

In the postscript Kuhn suggests a new term disciplinary matrix: disciplinary because it refers to the common possession of the practitioners of a particular discipline; “matrix” because it is composed of ordered elements of various sorts, each requiring further specification. Kuhn’s 1962 paradigms are constituents of the disciplinary matrix, and as such, they form a whole and function together. “Two groups, the members of which have systematically different sensations on receipt of the same stimuli, do in some sense live in different worlds”. There is no neutral algorithm for theory-choice, no systematic decision procedure which, properly applied, must lead each individual in the group to the same decision. Two men who perceive the same situation differently but nevertheless employ the same vocabulary in its discussion must be using words differently. They speak, that is, from incommensurable viewpoints.

In 1991, Kuhn explained that good reasons for belief could be supplied only by neutral observers, observers which are independent of influences of both beliefs and theories. These provide the stable Archimedean platform required to determine the truth or the probability of the particular belief, law, or theory to be evaluated (judgments). We cannot stand outside the theory and see the world as it is, i.e. compares our theories about the world with reality, the independent world. Only a fixed, rigid Archimedean platform can supply a base from which to measure the distance between current belief and true belief. However, we cannot connect our world of experience to the independent world, because the Archimedean platform outside of history, outside of time and space, is gone beyond recall. Hence, we have no neutral place to stand to evaluate whether or not our statements and propositions correspond to facts that obtain in the independent world.

Critics argued: Kuhn thinks that in order to be in a position to compare theories from older and more recent periods of normal science one needs a perspective external to each and indeed any era of science, but we never are able to escape from our current perspective.

Hilary Putnam argues that human beings are not in a position to judge whether or not our statements correspond to the independent world. To single out a correspondence between two domains, one needs some independent access to both domains. Kuhn talks as if each theory does refer-namely, to its own “world” of entities.

In 1988, in Dubbing and Redubbing Kuhn explained that a historian reading an out-of-date scientific text characteristically encounters passages that make no sense. Kuhn had this experience with Aristotle. It has been standard to ignore such passages or to dismiss them as the products of error, ignorance, or superstition, and that response is occasionally appropriate. Kuhn claims that the troublesome passages result in a different diagnosis. The apparent textual anomalies are artifacts, products of misunderstanding.

The historian has been understanding words and phrases in the text as he or she would if they had occurred in contemporary discourse. Through much of the text that way of reading proceeds without difficulty; most terms in the historian’s vocabulary are still used as they were by the author of the text. But some sets of interrelated terms are not, and it is the failure to isolate those terms and to discover how they were used that has permitted the passages in question to seem anomalous. Apparent anomaly is thus ordinary evidence of the need for local adjustment of the lexicon, and it often provides clues to the nature of the adjustment as well.

In his 1962 Structure Kuhn considered a pair of successive theories in the same historical line, Incommensurability meant that there was no common language into which both could be fully translated. Some statements constitutive of the older theory could not be stated in any language adequate to express its successor and vice versa. Incommensurability thus equals untranslatability, but what incommensurability bars is not quite the activity of professional translators. Kuhn adopts translation of that sort of Quine, Quine’s arguments for indeterminacy of translation: language is not universal. One must give up the assumption that anything expressible in one language, or by using one lexicon, can be expressed also in any other. Meaning must be abandoned. Anything that can be said in one language can, with sufficient imagination and effort, be understood by a speaker of another. What is a prerequisite to such understanding, however, is not a translation but language learning. Quine’s radical translator is, in fact, a language learner. Kuhn is suggesting that the problems of translating a scientific text, whether into a foreign tongue or into a later version of the language in which it was written, are far more like those of translating literature than has generally been supposed. In both cases the translator repeatedly encounters sentences that can be rendered in several alternative ways, none of which captures them completely. The content of alternative theories is unable to be compared due to the meaning variance of the terms employed by the theories. This leads to the reference problem: Different theories seem to employ the same terms to refer to different things. If reference remains stable through variation of conceptual content, no problem of theory comparison arises, since the reference is preserved even though terms may be associated with divergent conceptual content in the context of alternative theories.

Such a refined version of incommensurability was a target for attack. If it is impossible to compare theories either with respect to content or by means of common standards, then it is unclear how a decision between such theories may be made on an objective, rational basis. Such discontinuity in the transition between successive theories (discontinuity in reference), so that no term of a later theory refers to any entity referred to by an earlier theory, conflicts with scientific realism. The realist holds that successive theories in the same domain typically provide alternative descriptions of the same entities and that progress in science consists in an increase in truths known about a common set of entities. But if later theories refer to none of the same entities as earlier theories, then the realist account of scientific progress as an increase of truth about a common set of entities is untenable. The realist holds that the entities to which the terms of a theory refer exist independently of the theory, and that the world investigated by natural science is an objective reality which exists independently of human thought. But such assumption may not be shared by those anti-realist philosophers for whom the objects of reference and the world investigated by science depend in some way on human thought. Some anti-realist philosophers hold that the world and the objects it contains are constituted, either in whole or in part, by our theories, concepts or language. Such philosophers may deny that the terms of conceptually variant theories refer to the same objects since such theories constitute their own domains of reference. Hence, the question of whether later theories refer to the same entities as earlier theories raises metaphysical questions of a kind that tend to divide realism from anti-realism in the philosophy of science.

Critics have attacked Kuhn’s notion of semantic incommensurability. If we do take theories to be potential descriptions of the world, involving reference to worldly entities, kind, and properties, then the problems raised by incommensurability largely evaporate. Critics noted that causal theories of reference permit continuity of reference even through fairly radical theoretical change. Of course, the referentialist response shows only that reference can be retained. Consequently, it is only a partial defense of realism against semantic incommensurability. A further component of the defense of realism against incommensurability must be an epistemic one. For referentialism shows that a term can retain reference and hence that the relevant theories may be such that the later constitutes a better approximation to the truth than the earlier. Nonetheless, it may not be possible for philosophers or others to know that there has been such progress.


Hilary Putnam

Hilary Putnam’s criticism against Kuhn’s semantic incommensurability is embodied in the following notable fable from 1975. Putnam imagines our world has a Doppelgänger twin Earth, a planet just like our own. Let us suppose that somewhere in the galaxy there is a planet which we can call Twin Earth. Twin Earth is very much like Earth. People on Twin Earth speak English. People on Twin Earth who speak English, i.e. the ones who call themselves “Americans”, “Canadians”, “Englishmen” etc. There are a few differences regarding the standard English language on the earth. These differences themselves depend on some of the peculiarities of Twin Earth. One of the differences on Twin Earth compared to the conditions on Earth is that the liquid called “water” is not H2O but a different liquid with a very long and complicated chemical formula abbreviated xyz, indistinguishable from Water H2O at normal temperature and pressure. When Twin Earthians are thirsty they drink xyz. Water xyz tastes like water and it quenches thirst in the same way as Water H2O. The oceans and lakes, rivers and seas of Twin Earth contain water xyz and rain is consisted of the same liquid. The first contact of the Earthians with Twin Earth will produce a report: The word “water” has the same meaning on Earth and on Twin Earth. After the discovery that the liquid called “water” on Twin Earth is not H2O but xyz, the Earthians would correct their description: “On Twin Earth the word ‘water’ means xyz”. Hence the word “water” has two different meanings: on Twin Earth, what we call “water” (consisting of H2O molecules) simply isn’t water.

Let us return to the time when chemistry was not developed on Earth and on Twin Earth. Somewhere about the year 1750. The average Earthian (Oscar) did not know that water consisted of hydrogen and oxygen. The Twin Earthian (Twin-Oscar) did not know that “water” consisted of xyz. Hence, they would conclude that water and “water were the same and in 1750 no one on either Earth or Twin Earth could have distinguished water from “water”. Therefore, if Oscar and Twin-Oscar are not chemically or metallurgically educated, then there may be no difference at all in their psychological state when they use the word water and “water”.

Let us suppose we have a Doppelgänger on Twin Earth who is molecule for molecule identical to me. My Doppelgänger thinks the same verbalized thoughts as I do. In addition, he has the same sense data, the same dispositions, etc. Therefore, I and my Doppelgänger are in the same psychological state: It is absurd to claim that my Doppelgänger’s psychological state is one bit different from mine. My Doppelgänger cannot tell an elm from a beech tree. He means ‘beech’ when he says ‘elm’, and I on Earth mean elm when I say elm. Putnam concludes: “Cut the pie any way you like, “meanings” [that determine the extension of a term] just ain’t in the head! Hence, the psychological state of my Doppelgänger on Twin Earth and of myself on Earth cannot determine the extension (the group of things the term refers to) of any term.

According to Putnam, if we take into account only the individual psychological or cognitive state of Oscar and Twin-Oscar then water refers to “water” for Twin-Oscar. We do not have to rearrange in different ways the term water for Twin-Oscar. From a cognitive point of view, water is being understood by Oscar and Twin-Oscar as the same thing. Kuhn disagreed with Putnam.

Kuhn replied to Putnam: the report the visitors from Earth send home should not be about language but about chemistry. It must take some form like: “back to the drawing board! Something is badly wrong with the chemical theory, and that theory is incompatible with the existence of a substance with properties very nearly the same as water but described by an elaborate chemical formula. Such substance would be too heavy to evaporate at normal terrestrial temperatures. Its discovery and presence would demonstrate the fundamental errors in the chemical theory that gives meanings to compound names like H2O”.

In articles written between the late 1980s and early 1990s, Kuhn offered a new account of incommensurability, which localized meaning change to a restricted class of kind terms. These kind terms, together with their interconnections, form taxonomy that classifies the entities studied in a particular scientific field (taxonomic incommensurability). During a taxonomic change, some kind terms from the old taxonomy are preserved. But at the same time, some new kind terms are added, some old ones are deleted, and many others are rearranged in different ways. Meaning change happens only in a very restricted class of terms and there always exist unchanged concepts that may be used as the basis for rational comparison between rival paradigms. Through the localization of incommensurability, Kuhn hoped to deflect the charge of relativism. In 1993, Ian Hacking related this taxonomy to the world-change thesis: after a revolution, the world of individuals remains as it was, but scientists now work in a world of new kinds.

In 1983 and 1991, Kuhn redrew the picture of scientific revolutions. Changes in taxonomy capture the revolutionary features of paradigm shifts and the most important changes during scientific revolutions can now be conceptualized as taxonomic shifts. The role of taxonomy is not simply linguistic, but also cognitive and psychological. From a cognitive point of view, a taxonomy is a specific structure in the conceptual field defined by a frame. Kuhn sought to distinguish between translating a language (water into “water) and understanding it. Kuhn reasoned that while one might fail to translate from a foreign language into one’s own, it need not follow that one must fail to understand the other language. The combination of these two points yields a refined version of semantic incommensurability, on which translation failure is restricted to specialized vocabularies with a language, which is capable of being understood by rival theories.

Putnam thought that in particular, the individual psychological state of a person does not fix the extension or reference of a term; it is only the sociolinguistic state of the collective linguistic group to which the individual belongs that fixes the extension. Every linguistic community possesses at least some terms that are known only to a subset of the speakers who acquire the terms, and whose use by the other speakers depends upon a structured cooperation between them and the speakers in the relevant subsets.

Sorry no reference list is added here on the blog (to prevent student copying)


פילוסופיה של הפיזיקה – הפרדוקס של איינשטיין-פודולסקי-רוזן, אפ”ר ותורת היחסות הפרטית

תיאור קוונטי אורתודוקסי של מערכת קשור בשלושה אלמנטים: משייכים למערכת מצב קוונטי (וקטור במרחב הילברט). ההמילטוניאן של המערכת קובע כיצד המצב הזה יתפתח עם הזמן כל עוד לא מבוצעת מדידה על המערכת. לבסוף כאשר מבוצעת מדידה או תצפית על המערכת המצב הקוונטי משתנה בצורה בלתי רציפה וזו משקפת את תוצאת המדידה, מה שקרוי קריסת גל.

כאשר מבצעים מדידות על שני חלקיקים נפרדים ורחוקים זה מזה, אבל החלקיקים הם בקורלציה קוונטית, כלומר במצב של שזירה קוונטית, כמו בניסוי של איינשטיין, פודולסקי ורוזן (ניסוי אפ”ר), מוצאים שהמאפיינים של חלקיק אחד נקבעים על ידי תוצאות המדידה בחלקיק האחר. פירושו שתצפית בצד אחד של הניסוי גורמת לקריסת המצב הקוונטי לערך מוגדר. לאיזה ערך מוגדר? לפי הפירוש האורתודוקסי למכניקת הקוונטים הדבר אינו בשליטתנו. קריסת פונקצית הגל היא תהליך מיידי ובלתי תלוי בהפרדה המרחבית בין שני החלקיקים.

איינשטיין, פודולסקי ורוזן הציעו את ניסוי אפ”ר EPR ב-1935. מהניבויים של מכניקת הקוואנטים ועקרון אי הודאות, ישנן קבוצות מסוימות של משתנים, שאם אחד מהם ידוע בוודאות האחר לחלוטין לא ידוע. בשפה המתמטית של תורת הקוונטים אומרים שאם האופרטורים עבור שני משתנים נצפים אינם קומוטטיביים, רק משתנה אחד מבין שני המשתנים יכול להיות ידוע בדיוק ברגע נתון. אם ניקח את המיקום והתנע כדוגמא. עקרון אי הודאות אומר לנו שאם אנו יודעים את התנע המדויק של המערכת, נניח של חלקיק חופשי, המיקום שלו הוא לגמרי בלתי ידוע. כך שאם התנע של חלקיק ידוע בהסתברות שהיא 1, אנו לא יכולים לדעת בהסתברות 1 את המיקום של אותו חלקיק.

כתוצאה מעיקרון אי הודאות של הייזנברג לא ניתן לקבוע בוודאות כמויות בלתי תואמות. דומה שזה מפר את התנאי המספיק לריאליזם של כמות פיזיקאלית, לפיו ניתן לנבא כמות פיזיקאלית בוודאות מבלי להפריע למערכת – (או המאפיינים המדידים של המערכת הפיסיקאלית קיימים ומוגדרים היטב בנפרד מכל השפעה חיצונית ומהתצפיות). לכן, אם לפי עיקרון אי הוודאות לא ניתן לנבא כמות בוודאות מוחלטת, מכניקת הקוונטים היא לא שלמה. אם לא ניתן לדעת בוודאות בו-זמנית את המיקום והתנע של חלקיק, איינשטיין חשב שמכניקת הקוואנטים היא לא שלמה, שחסר בה משהו, משהו ריאליסטי (משתנים חבויים) שכן יאפשר לנו לדעת אותם בוודאות. אבל אפשר לחשוב שמכניקת הקוואנטים היא לגמרי שלמה ושלא חסר בהסבר שלה כלום. במקרה כזה התוצאה של עיקרון אי הוודאות פשוט אומרת לנו שבעיקרון לא ניתן לקבוע בוודאות ערכים בלתי תואמים בו-זמנית.

אפ”ר החליטו להפריך טענה זו. בעזרת ניסוי אפ”ר איינשטיין שאף להראות שלכמויות קומפלמנטריות (בייחוד מיקום ותנע) יכולים להיות ערכים ריאליסטים, אלמנטים של המציאות, בו-זמניים; ואז המסקנה המתבקשת היא שחסר הסבר במכניקת הקוונטים שיכיל אותם. לפיכך, התיאור שמסופק על ידי פונקצית הגל של המערכת לא יהיה שלם ולא ניתן להסיק שמכניקת הקוונטים היא שלמה.


אפ”ר הציעו את הניסוי הבא ב-1935: נניח שיש לנו שתי מערכות A ו-B (שיכולות להיות שני חלקיקים חופשיים), שפונקציות הגל שלהן לא ידועות. אחר כך הן באינטראקציה למשך זמן קצר וניתן לקבוע את פונקצית הגל שנובעת מאינטראקציה זו בעזרת משוואת שרדינגר (השנה היא 1935…). נניח שעכשיו המערכות נעות הרחק זו מזו, כל כך רחוק זו מזו, שהן לא יכולות להיות באינטראקציה יותר זו עם זו בשום דרך שהיא. לפי תורת היחסות הפרטית הן מופרדות בצורה כזו ששום סיגנל אור לא יכול לעבור ממערכת אחת לשנייה. מדידות שמבוצעות רחוק זו מזו לא יכולות להשפיע זו על זו. תנאי זה פירושו שההסתברות למדידה על A היא פונקציה של המשתנים של A בלבד. תנאי זה הוא תנאי הלוקאליות. אבל ניתן להסיק את הערכים של מערכת B רק מקריסת פונקצית הגל. בזמן המדידה שתי המערכות הן לא באינטראקציה יותר. לכן הגיוני להניח, כך מסיק איינשטיין, שאם שני החלקיקים A ו-B היו קודם לכן באינטראקציה ואילו עתה הם מופרדים, התוצאות של המדידות על A לא צריכות להשפיע על B בשום דרך שהיא. תנאי זה פירושו שניתן להפריד את ההסתברויות עבור המדידות שמבוצעות על A ועל B (ההסתברויות עבור המדידות של A ו-B הן שתי פונקציות נפרדות ובלתי תלויות זו בזו). זהו תנאי ההפרדה (ספרביליות). כלומר, בזמן שמדידות מבוצעות על מערכת A ישנה מציאות ששייכת למערכת B בלבד. כך מערכת B שומרת על זהותה הנפרדת למרות שהיא קשורה ל-A.

אבל אם יוצאים מתוך ההנחה שמכניקת הקוונטים היא תיאוריה שלמה (הפירוש האורתודוקסי למכניקת הקוונטים שנתקבל כתוצאה מפשר קופנהגן), המדידה על A משנה בצורה טלפתית את המצב של B (הפרה של עקרון הלוקאליות והספרביליות), כי השינוי מתרחש מיידית תוך העברת מידע במהירות אינסופית וזה מפר את עקרון קביעות מהירות האור בתורת היחסות הפרטית; ולפיכך מפר את יחסיות הבו-זמניות.

איינשטיין כמובן מיד נזעק ואמר שלנוכח סתירה בוטה זו, אם למרות ש-A ו-B מופרדים מרחבית – אי לוקלאיות – שניהם נחשבים למערכת אחת, כלומר פונקצית גל בסופרפוזיציה ולא נחשבים לשני חלקים ממשיים נפרדים, אז יש לשייך קיום נפרד לכל אחד משני חלקי המערכת. עלינו להביט על שתי המערכות A ו-B המופרדות מרחבית כבעלות מצבים ריאליסטים נפרדים, שהם בלתי תלויים באקט המדידה. ולכן איינשטיין מסיק מכך שיש לשייך ערכים ריאליסטים עבור התנע והמיקום של המערכת B.

בשנת 1950 דיויד בוהם ניסח מחדש את ניסוי האפ”ר המקורי בצורת מדידה של חלקיקי ספין חצי. באנלוגיה לניסוי המחשבה של בוהם, מכיוון שיותר קל למדוד קיטוב של פוטונים מאשר את הכיוון של חלקיקי ספין חצי, ניתן להשתמש במסנן קיטוב במקום במכשיר שטרן-גרלך. נבחן שני חלקיקים, שכתוצאה מאינטראקציה כלשהי או תהליך יצירה כלשהו, כל אחד מהם יכול לקבל אחד משני מצבים קוונטיים אפשריים. נגיד שהחלקיקים הם פוטונים ושני המצבים האפשריים הם קיטוב אנכי ואופקי. שני הפוטונים תמיד מגיחים מהאינטראקציה במצבים מנוגדים של קיטוב ליניארי: אחד אנכי והשני אופקי, אבל לא שניהם אופקיים או שניהם אנכיים. אין לנו כל דרך מעשית לדעת איזה פוטון מגיח באיזה מצב.

המצב הקוונטי המשולב הדו-חלקיקי הוא שילוב ליניארי של מכפלת המצבים של שני הפוטונים. כתוצאה הפוטונים אבדו את עצמאותם והם בשזירה קוונטית. ב-1964 ג’ון בל פרסם ניסוי מחשבה – שהוא גרסה לניסוי האפ”ר, ניסוי  EPR-BELL – כלומר EPRB שנועד להבחין בין מכניקת הקוונטים לתיאוריות המשתנים החבויים הלוקאליות. בגרסה של בל לניסוי האפ”ר מכניקת הקוונטים ותורות המשתנים החבויים הלוקאליות ניבאו מבחינה סטטיסטית תוצאות ניסוייות שונות.

הגרסה של ניסוי בל, ניסוי EPRB, בוצעה במעבדה על ידי אלן אספה והניבויים של מכניקת הקוונטים אושרו; ולכן הרעיון של איינשטיין לפיו יש לשייך קיום נפרד לכל אחד משני החלקיקים בשזירה הקוונטית בגלל הסתירה עם תורת היחסות הפרטית נפל. בל הדגים תיאורטית שאילו הערכים בקורלציה היו בגלל סיבות לוקאליות, כפי שאיינשטיין סבר, הם היו מספקים סדרה של אי שיוויונים, שברבות הימים נקראו על שמו “אי שוויני בל”. אבל לפי הפירוש של תורת הקוונטים האורתודוקסית והניסויים שבוצעו על ידי אספה והניסויים המאוחרים יותר, אי שוויוני בל מופרים על ידי קריסה מיידית ולא לוקאלית של פונקצית הגל עבור שני הפוטונים; ולכן לא יתכן הסבר לקורלציה בין החלקיקים בניסוי אפ”ר על בסיס הסיבתיות הלוקאלית. ראו כאן.

אם בוחנים את ניסוי אפ”ר במערכת הייחוס של המעבדה ומביטים בדיאגראמת המרחב-זמן של מינקובסקי, מגלים שאירועי המדידה של החלקיקים הקוונטיים בניסוי אפ”ר הם בעלי הפרדה דמוי-מרחבית. לכן כמו שאיינשטיין הבחין לראשונה ב-1935, אם רוצים לספק הסבר לניסוי על בסיס השפעות לוקאליות של חלקיק אחד על השני, ההסבר צריך להיות מבוסס על השפעות שנעות במהירות גבוהה מזו של האור, למעשה במהירות אין סופית; אפשר לומר את זה גם כך: צריך להשיב את הפעולה למרחוק לפיסיקה, שפועלת מיידית, פועלת על חלקיק שנמצא במרחק עצום ממכשיר המדידה שלנו. חיבור לא לוקאלי בין שני חלקיקים מרוחקים מייצג קשיים רבים בפירושים במכניקת הקוונטים והוא מוקד המתיחות בין תורת הקוונטים לתורת היחסות הפרטית – ובגלל המתיחות הזו איינשטיין כתב כעשר שנים מאוחר יותר לחברו מקס בורן ב-1947 שמדובר ב”פעולה למרחוק של רוחות רפאים”.

אבל ברבות הימים חוקרים בכל זאת חשבו שחייבת להיות תקשורת מוזרה בין החלקיקים בשזירה קוונטית והם שאלו את עצמם: האם אנחנו יכולים לנצל את התקשורת המוזרה שקיימת בין הפוטונים השזורים המרוחקים כדי לשלוח הודעות במהירות על אורית?

נבחן ניסוי מחשבה בו ישנה מערכת תקשורת על אורית שפועלת על עקרון השזירה הקוונטית. למערכת יש משדר, מקלט וחוט שמקשר ביניהם והוא מורכב משני פוטונים בקורלציה, שנפלטים ברציפות לכיוונים מנוגדים במרווחי זמן קבועים, כל עשר ננושניות. הפוטונים שמרכיבים זוג מתוזמנים כדי להגיע בו-זמנית למשדר ולמקלט. במשדר יש מתג שמכוון את הפוטון הראשון בין שני מסלולים אופטיים. המסלול הראשון מוביל את הפוטון לפילטר קיטוב שמכוון עם צירו למעבר מקסימאלי בכיוון האנכי והמסלול השני מוביל לפילטר מקטב שמכוון לכיוון האופקי. המשדר מזהה גילוי פוטון שעבר דרך המקטב האנכי כ-1 וכזה שעבר דרך המקטב האופקי כ-0. למקלט שממוקם על הירח יש רק פילטר אחד שמכוון אנכית.

נגיד שישנם שני גלאים, שנהוג לכנותם בז’רגון של תורת הקוונטים בשם אליס ובוב, והם מעבירים ביניהם מסרים. אליס היא על כדור הארץ והיא רוצה לשלוח מסר שמקודד לקוד בינארי בעל ארבע אותיות 1001 לבוב על הירח. הפוטון הנכנס מגיע למתג במשדר והוא מעבירו למקטב האנכי. הגילוי שלו מאלץ את הפוטון של בוב למצב קיטוב אנכי. הספרה הועברה מיידית או במהירויות שהם פי עשרת אלפים ויותר ממהירות האור. כאשר המשדר רוצה לשלוח 0 המתג מעביר את הפוטון הנכנס למקטב האופקי. הגילוי שלו מאלץ את הפוטון של בוב למצב אופקי, שנחסם על ידי המקטב במקלט: מכיוון שהמקלט מצפה לפוטון הבא תוך 10 ננושניות והוא לא מגיע, המקלט מזהה חוסר גילוי כ-0. התהליך נמשך עד שכל הספרות התגלו תוך כמה ננו שניות ולמעשה התקשורת היא מיידית וניתן גם למקם את המקלט על גלקסיה אחרת.

המהלך נראה מושלם, אבל למרבה הצער הוא לא יכול לפעול ולכן אף אחד עד היום לא רשם עליו פטנט. כאשר הפוטון של אליס עובר דרך המתג במשדר הוא לא מנותב אוטומטית למצב של קיטוב אנכי. לפי תורת הקוונטים יש לו הסתברות שווה לקיטוב אנכי ואופקי; ולנו אין כל אמצעי ניבוי מראש מה יהיה הקיטוב. אנחנו יכולים למדוד את הקיטוב של הפוטון אחרי שמתרחשת קריסה, אבל אין שום דרך לשלוט איזה מבין שני הקיטובים יקבל הפוטון במהלך הקריסה. אליס שמודדת ובכך גורמת לקריסה של פוטון אחד מזוג הפוטונים בשזירת אפ”ר לא יכולה בשום דרך ואמצעי מכוון להשפיע על התוצאה שאותה בוב יקבל כאשר הוא מודד את הפוטון האחר. לכן העברת הפוטון של אליס למקטב האנכי לא מבטיחה שהפוטון של בוב יאולץ למצב של קיטוב אנכי. עדיין יש סיכוי של 50 אחוז שהפוטון של בוב יעבור או יחסם על ידי המקטב במקלט שלו. לא ניתן להעביר שום הודעה בין בוב לאליס באמצעות השזירה הקוונטית במהירות על-אורית. הדרך היחידה היא שאליס תודיע לבוב את תוצאות המדידה שהיא ביצעה וקבלה באמצעות ערוץ תקשורת רגיל וקלאסי וזה מגביל את מהירות התקשורת לזו של מהירות האור.

 לפי הפירוש האורתודוקסי למכניקת הקוונטים הקיטובים של הפוטונים הם כלל לא מוגדרים לפני המדידה. בהתחלה שני הפוטונים הם במצבי סופרפוזיציה של קיטוב אנכי וקיטוב אופקי. וכאשר המדידה של פוטון אחד מתרחשת, רק אז שני הפוטונים יחד קורסים לקיטוב מוגדר היטב. מכניקת הקוונטים לא מגדירה במדויק את הקיטובים ומה הם הקיטובים עבור זוג הפוטונים לפני שהם נמדדים. ויותר מזה, מכניקת הקוונטים לא מוכנה בכלל לקבל את המושג “קיטוב מוגדר” של כל אחד מהפוטונים בשזירה כמשהו תקף בתיאוריה. אנחנו יכולים להגדיר את הקורלציה בין הפוטונים, אבל לא את הקיטוב הנפרד של כל פוטון. כל פוטון הוא במצב של שזירה וסופרפוזיציה עם הפוטון האחר.

לכן הקשר הקוונטי פירושו תופעה חדשה. אמנם דומה שהתופעה קונסיסטנטית עם תורת היחסות הפרטית, שאוסרת מעבר מידע במהירות על-אורית, אבל המחיר הוא מסתורין קוונטי. שימו לב שהנימוקים האלה התקבלו מתוך שיקולים קוונטיים ואין כאן כלל נימוקים ייחסותיים והסבר יחסותי.

עתה נתמקד בשיקולים ייחסותיים. בהנחה ששום מסר אינו יכול לנוע מהר יותר מהאור, אם אנחנו רוצים להעביר תשדורת לגבי האופן שבו הגלאים A ו-B המודדים בניסוי האפ”ר יהיו מסודרים, עלינו להעבירה לפני שאנחנו מסדרים את הניסוי כדי שהיא תגיע בזמן. לכן עלינו להניח שהכיוון של הגלאי המרוחק וההתנהגות של הפוטון המרוחק B הם נקבעים על ידי אירועים בתוך קונוס האור של העבר (קונוס העבר). אבל תיאוריה כזו מיד נופלת בגלל שקשה לדמיין שאירועים כאלה בעבר ישפיעו על פוטונים שהם מרוחקים זה מזה. אין שום אמצעי שבאמצעותו סיגנל תת-אורי וסיגנל אורי מהעבר יכול לספק את המידע מצד אחד של הניסוי לצד האחר. גם אם נאפשר לפוטון לבסס את תגובותיו על כל האירועים מקונוס העבר שלו, לא נצליח למצוא אסטרטגיה שתשיב את הקורלציה הקוונטית. הבעיה היא שבעקרון הכיוון של הגלאי המרוחק B לא נקבע על ידי האירועים בקונוס העבר. נגיד שנאמץ תיאוריה לוקאלית דטרמיניסטית (ניתן להשתמש בידע השלם אודות המצב העכשווי של המערכת הפיסיקאלית כדי לקבוע את המצב העתידי של המערכת) או לוקאלית סטוקאסטית; ונניח ששום השפעה סיבתית לא יכולה להתפשט מהר יותר מהאור. גם אם נגיד נבחן אירוע בתוך קונוס העבר והסבר על פי תיאוריה סטוקסטית כזו, לשום אירוע כזה לא יכולה להיות השפעה מחוץ לקונוס האור של העתיד (קונוס העתיד) שלו. האירועים בקונוס העבר יכולים להשפיע רק על האירועים בקונוס העתיד ולא על אירועים שהם מופרדים דמוי-מרחבית. לאירועים בתוך קונוס האור אין השפעה ישירה על אירועים דמוי-מרחביים וישנו חיץ בין הקורלציות הקוונטיות הדמוי-מרחביות (בעלות סיבה משותפת) וכל האירועים בתוך קונוס העבר.

כאשר מצב בשזירה קורס על ידי אינטראקציה עם אחד משני החלקיקים, החלקיק השני קורס באמצעות תהליך לא-לוקאלי וסופרפוזיציה מייצגת מצב בלתי מוגדר (טיעון נגד הריאליזם) והקריסה למצב מסוים היא תהליך אקראי (טיעון נגד הדטרמינזם).

אולם חוקרים ניסו להסביר את ניסוי אפ”ר על ידי תיאורית העולמות המרובים של יו אברט שמשמיטה את קריסת פונקצית הגל לפיה אין קריסה של פונקצית הגל. לכן מדובר בתהליך מדידה ובצופים בשזירה שמתפצלים לעולמות מקבילים. אבל למעשה תיאורית העולמות המרובים היא תיאוריה לוקאלית: התפצלות לעולמות מרובים היא תהליך לוקאלי. בנוסף, כל האפשרויות קיימות בכל העולמות. אם יש חוקרים שמקווים שהמצב הקוונטי ייצג “ממשות” של פוטון, תיאורית העולמות המרובים מעבירה את הריאליזם למקום אחר: יש יותר מידי ריאליזם, ישנן ריבוי מציאויות מוגדרות. פירוש העולמות המרובים מחזיר גם את הדטרמיניזם: פונקצית הגל מתפתחת בהתאם למשוואת גלים דטרמיניסטית וכל תוצאה אפשרית של המדידה מתממשת בעולם משלה. הבעיה היחידה היא שצופה בעולם אחד יכול להתלונן על כך שהוא קיבל תוצאה X ולא Y בניגוד למה שהוא חזה בהתחלה.

נבחן את ניסוי האפ”ר לפי פירוש העולמות המרובים: המדידה של חלקיק A מתפצלת לשתיים באמצעות תהליך לוקאלי ואז שוב מתפצלת. בגלל שאין קריסת פונקצית גל הצופה ליד A צריך להודיע לצופה ליד B את תוצאות המדידה שלו ואז כל אחד מהם מיד מתפצל – וזה קורה באמצעות שרשרת של אירועים לוקאלית במהירות תת-אורית וכמובן ללא סתירה עם תורת היחסות הפרטית.

אולי טכיונים, שבהגדרה נעים מלכתחילה במהירות על-אורית, מסוגלים להסביר את ניסוי האפ”ר והפרת אי שוויוני בל? או אולי בכלל ניתן להשתמש בטכיונים לתקשורת על אורית, סוג נוסף של טלפון בל? האם אפשר לשלוח מסר או טלגרף מאזור מדידה אחד בניסוי אפ”ר לאחר באמצעות תקשורת על-אורית לא לוקאלית טכיונית?

הבעיה בטכיונים היא שמערכות ייחוס שונות עשויות לא להסכים ביניהן על הסדר הזמני שבו מתרחשים האירועים ולכן לגבי מה מרכיב את העבר של אירוע כלשהו, אבל עדיין כל מערכת ייחוס מסוגלת להרכיב סיפור שהוא קונסיסטנטי למבנה הזמני שלה. בסיגנלים שנעים במהירות תת-אורית הפליטה של הסיגנל תמיד מתרחשת לפני קבלתו. לגבי הטכיונים שנעים במהירות על אורית, במערכות ייחוס מסוימות, הקבלה של הסיגנל העל אורי עשויה להיות לפני השליחה שלו. פירושו שהסיגנל נע אחורנית בזמן ולכן במערכות ייחוס אלה התוצאה קודמת לסיבה. הסדר הזמני נובע ממהירות האור ומהעברת הסיגנלים והמידע בסיגנלים. טכיונים גורמים לבעיות בגלל שאם משתמשים בהם לשלוח מסרים אחורנית בזמן תהיה להם אנרגיה שלילית ולכן הם יצרו חוסר יציבות דינמית. האם כדי להעביר מידע הטכיונים זקוקים להעביר אנרגיה? פוטונים חסרי מסה מוגבלים לקונוס האור בגלל שהם נושאים אנרגיה במהירות האור. אבל אם נשתמש בטכיון חסר מסה, האנרגיה והתנע של חלקיק חסר מסה על אורי הם אפס וטכיון כזה יכול להעביר מידע ללא אנרגיה.

נגיד שנצליח לנטרל את האלמנט שהטכיונים נעים אחורנית בזמן על ידי הצבת תנאי קונסיסטנטי כלשהו. כדי לבצע את העבודה הטכיונים צריכים לשאת את המידע במהירות על אורית מצד אחד של ניסוי אפ”ר לאחר. נניח שבניסוי אפ”ר במערכת ייחוס מסוימת (יחסית למערכת המעבדה) כאשר מבוצעת מדידה (אנחנו צופים בפוטון הראשון A), בדיוק ברגע התצפית הזו הפוטון  A שולח טכיון לפוטון השני B והטכיון מעביר לו את המידע שעליו להיות בקורלציה עם תוצאת המדידה שכבר בוצעה על הפוטון הראשון A. כלומר, הטכיון גורם לפוטון B להגיב בהתאם. הטכניונים הם לכן “משתנים חבויים”. במצב זה מניחים שהקיטובים של הפוטונים הם מוגדרים היטב – הנחה ריאליסטית – והם מתוארים במדויק על ידי המשתנים החבויים. ואז במערכות ייחוס מסוימות תסריט זה פועל. אם במערכת ייחוס נתונה אירוע הגילוי של הפוטון הראשון A מתרחש לפני האירוע שבו הטכיון פוגש את הפוטון השני B, רצף האירועים יכול להתפרש כך שהטכיון נפלט כאשר צופים בפוטון A ונבלע על ידי בן זוגו B בדיוק בזמן כדי שתהיה לו השפעה על התנהגותו.

אבל עקב היותו של הטכיון בהגדרה חלקיק שנע במהירות על אורית ישנן מערכות ייחוס שבהן הטכיון הוא חסר תועלת: בהן הטכיון נפלט על ידי הפוטון הראשון A בטרם זה נמדד ולכן הוא אינו מסוגל לשאת מידע שימושי לפוטון השני B בעת שהוא מגיע לאירוע התצפית; וגרוע מזה, הפוטון השני B פולט טכיונים ברגע שבו הפוטון הראשון A מכוון. קורלציות אלה בין פוטונים מרוחקים באירועים דמוי מרחביים הן בדיוק אלה שהתחלנו איתן.

למעשה ישנן בעיות גם במערכות הייחוס שבהן הסדר הזמני הוא נכון: הקיום של הטכיון צריך להיות תלוי באופן המדידה שמבוצעת על הפוטון הראשון A. צריכה להיות קורלציה חזקה בין כיוון מכשיר המדידה של הפוטון A וזה של המכשיר של הפוטון B כדי שזה יקבל מידע שימושי מהטכיון. לכן טכיון שנע במהירות על-אורית מלכחתילה לא עוזר לפתור את אי הלוקאליות והקורלציות הקוונטיות.

אם מביטים על מערכת הקורלציה הדו-חלקיקית של ניסוי אפ”ר מנקודת המבט של תורת השדות הקוונטית, ניתן לחשוב על האפקטים הקוונטיים ככאלה שמשנים את גיאומטרית מינקובסקי. ב-2007 חוקרים הציעו תיאורית משתנים חבויים יחסותית נוספת: עבור מודל אפ”ר האפקטים הקוונטיים גורמים למטריקה המינקובסקית לעבור טרנספורמציה למטריקה חדשה. מתקבלת גיאומטריה שהיא אפקטיבית בעלת שתי סינגולאריות במטריקה והיא בדיוק בעלת תבנית של גשר כמו חור תולעת. בדרך כזו ניתן לפרש את הקורלציות שבניסוי אפ”ר ככאלה שנובעות מחור תולעת אפקטיבי שמקשר בין שני החלקיקים בניסוי אפ”ר ודרכו מועברים או מתפשטים סיגנלים – ולכן לא זקוקים לטכיונים. המרחב-זמן מתעוות, המרחק מתקצר. אבל תיאור כזה מחמיץ את האי-לוקאליות, חוסר הדטרמיניזם וחוסר הריאליזם שבקורלצית האפ”ר.

ב-1999 סטיבן וינברג הציע תיקון לא ליניארי קטן למשוואות הגלים של מכניקת הקוונטים הסטנדרטית. התברר שכאשר מיישמים את התיאוריה של וינברג לקורלציות בין חלקיקי האפ”ר ניתן להעביר מסר מיידי בין החלקיקים הקוונטיים בניסוי האפ”ר. מכאן הגיעו למסקנה שמכניקת הקוונטים הלא ליניארית מפרה את הסיבתיות ויתכן טלפון אפ”ר (תקשורת בין צופים לא לוקאליים). אולם ג’וזף פולכינסקי הראה שהאפקטים העל-אוריים הם טעות שנגזרת מהניסוח המסוים של וינברג ואם נכליל את הניסוח של וינברג הטעות תעלם. מיד הופיעו חוקרים שהדגימו: לא רק שהקושי של הופעת ההשפעות העל-אוריות ייחודי לניסוח של וינברג, אלא המתכון של פולכינסקי לתורות קוונטיות לא ליניאריות קוזאליות שלא מכילות השפעה על אורית נופל.

אם כך, האם תורת היחסות מופרת? הויכוח נמשך בספרות. לפי הקונסנזוס הסטנדרטי במכניקת הקוונטים – אנחנו נותרנו עם המסתורין הקוונטי, קשר קוונטי מסתורי בין חלקיקים. זהו המחיר שמשלמים כדי לא להפר את עקרונות תורת היחסות הפרטית. אם ננסה להסביר קורלציות קוונטיות לא לוקאליות על ידי השפעה היפותטית לוקאלית וריאליסטית, השפעה כזו תצטרך לנוע במהירות על אורית ולא סתם, אלא במהירות אינסופית.

בניגוד להסברים הלוקאליים הריאליסטיים שמאלצים אותנו להשתמש בתמסורת על-אורית, הפירוש הסטנדרטי המקובל במכניקת הקוונטים האורתודוקסית אומר, ששום מידע לא מועבר בין קצה אחד של ניסוי אפ”ר לקצה השני; כלומר, אין למעשה קונפליקט בין תורת הקוונטים לתורת היחסות וזאת בגלל שצופים שהם מופרדים מרחבית (אי לוקאליות) בניסוי מסוג האפ”ר לא יכולים להשתמש בבחירות המדידה שלהם ובתוצאות המדידה שלהם כדי לתקשר זה עם זה וכדי להעביר מידע זה לזה. מכניקת הקוונטים אף מרחיקה לכת באומרה שהריאליסטים מחשיבים את מדידות הקיטוב לקיטוב של פוטונים ממשיים. אולם, ניתן לחשוב על ניסוי אפ”ר כעל קורלציה סטטיסטית בין מכשירי המדידה בלבד מבלי לדבר כלל על פוטונים, אלא רק על מדידות ונתונים… ג

אחד המחקרים האחרונים בתחום מסוף אוקטובר