# 同源策略

出于安全的考虑,浏览器有个同源策略,对于不同源的站点之间的相互请求会做限制(跨域限制是浏览器行为,不是服务器行为)。同源指的是域名(或IP)、协议、端口都相同,不同源的客户端脚本在没有明确授权的情况下,不能读写对方的资源。

# 同源的判定

http://www.example.com/dir/page.html 为例

http://www.example.com/dir/page2.html // 同源 同协议同域名同端口
http://www.example.com/dir2/other.html // 同源 同协议同域名同端口
http://user:pwd@www.example.com/dir2/other.html // 同源 同协议同域名同端口
http://www.example.com:81/dir/other.html // 不同源 端口不同
https://www.example.com/dir/other.html // 不同源 协议不同
http://en.example.com/dir/other.html // 不同源 域名不同
http://example.com/dir/other.html // 不同源 域名不同
http://v2.www.example.com/dir/other.html // 不同源 域名不同
http://www.example.com:80/dir/other.html // 不确定 取决于浏览器的实现方式

# 源继承

来自 about:blankjavascript:data:URLs中的内容,继承了将其载入的文档中所指定的源,因为它们的URL本身未指定任何关于自身源的信息。

# 变更源

变更源可以实现基础域相同的不同页面的跨域问题。如:a.baidu.com/index.html 通过 iframe 引入 b.baidu.com/index.html,但是a中的JS是不能操作b中的内容的,但是可以通过修改源来实现,需要在a和b中都修改domain,即 document.domain = 'baidu.com'

注意:document.domian的修改必须是当前域或者当前域的基础域,如在a中 document.domain = 'b.baidu.com' 是报错的

# 跨域方案

# document.domain + iframe

这种方式就是上面说的变更源。在 a.name.com/a.html 中:

document.domain = 'name.com';

var ifr = document.createElement('iframe');
ifr.src = 'http://b.name.com/b.html';
ifr.display = none;
document.body.appendChild(ifr);

ifr.onload = function() {
    var doc = ifr.contentDocument || ifr.contentWindow.document;
    // 在这里操作doc 也就是b.html
    ifr.onload = null
};
// b.name.com/b.html
document.domain = 'name.com';

# 动态创建script

// 因为script标签不受同源策略的限制
function loadScript(url, func) {
    var head = document.head || document.getElementByTagName('head')[0];
    var script = document.createElement('script');
    script.src = url;

    script.onload = script.onreadystatechange = function() {
        if (!this.readyState || this.readyState === 'loaded' || this.readyState === 'complete') {
            func();
            script.onload = script.onreadystatechange = null;
        }
    };

    head.insertBefore(script, script[0]);
}

window.baidu = {
    sug: function(data) {
        console.log(data);
    }
}
loadScript('https://www.baidu.com', function(){console.log('loaded')});

# window.name + iframe

window对象有个 name 属性,该属性有个特征:即在一个窗口(window)的声明周期内,窗口载入的所有页面都是共享一个 window.name 的,每个页面对 window.name 都有读写的权限,window.name 是持久存在一个窗口载入过的所有页面中的,并不会因新页面的载入而进行重置。通过在 iframe 中加载一个资源(目标页面),该目标页面将设置iframe的name属性,此name属性可以被获取到,以访问服务发送的信息,但name属性仅针对相同域名的iframe可访问,这意味着为了访问name属性,当远程web服务页面被加载后,必须导航iframe回到原始域,同源策略依旧防止其他iframe访问name属性,一旦name属性获得,销毁iframe。

在最顶层,name属性是不安全的,对于后续所有页面,设置在name属性中的任何信息都是可获得的,然而windowName模块总是在一个iframe中加载资源,并且一旦获取到数据,或者当你在最顶层浏览了一个新页面,这个iframe将被销毁,所以其他页面永远访问不到window,name属性。

<!DOCTYPE html>
<html>
    <head>
        <meta charset="utf-8">
        <title></title>
        <script>
            function getData() {
                // 此时window.name已被修改为b.com/b.html页面设置的数据
                var iframe = document.getElementById('proxy');
                iframe.onload = function() {
                    var data = iframe.contentWindow.name; // 获取iframe中window.name,也就是b.com/b.html设置的数据
                    console.log(data);
                    document.removeChild(iframe); // 获取到数据后销毁iframe
                }
                iframe.src = 'about:block'; // 设置src,让iframe与当前页面同源,src被修改后会重新load然后触发上面的onload
            }
        </script>
    </head>
    <body>
        <iframe id="proxy" src="b.com/b.html" onload="getData()"></iframe>
    </body>
</html>

b.com/b.html 设置数据:

<html>
    <script type="text/javascript">
        window.name="Hello";
    </script>
</html>

# postMessage

window.postMessage(message, targetOrigin) 方法是HTML5中 XMLHttpRequest Level 2 中的API。可以使用它来向其它的window对象发送消息。无论这个window对象是属于同源或不同源。

调用 postMessage 方法的window对象是指要发送消息的那一个window对象,该方法的第一个参数message为要发送的消息,类型只能为字符串,第二个参数targetOrigin用来限定接收消息的那个window对象所在的域,如果不想限定域,可以使用通配符 *

需要接收消息的window对象,可以通过监听自身的message事件来获取传过来的消息,消息内容储存在该事件对象的data属性中。

上面所说的向其他window对象发送消息,其实就是指一个页面有几个框架的那种情况,因为每一个框架都有一个window对象。不同域的框架间是可以获取到对方的window对象的,而且也可以使用window.postMessage 方法。

a.com/index.html

<!DOCTYPE html>
<html>
    <head>
        <meta charset="utf-8">
        <title></title>
        <script>
            var iframe = document.getElementById('iframe');
            iframe.contentWindow.postMessage('我是a.com/index.html的消息', '*');
        </script>
    </head>
    <body>
        <iframe id="iframe" src="b.com/index.html"></iframe>
    </body>
</html>

b.com/index.html

<script>
    window.onmessage = function(e) {
        e = e || event;
        alert(e.data);
    }
</script>

# CORS

CORS是一个W3C标准,全称是 跨域资源共享 (Cross-origin resource sharing)。它允许浏览器向跨源服务器,发出XMLHttpRequest (opens new window) 请求,从而克服了AJAX只能同源使用的限制。

CORS需要浏览器和服务器同时支持。整个CORS通信过程,都是浏览器自动完成,不需要用户参与。对于开发者来说,CORS通信与同源AJAX没有区别,代码完全一样。浏览器一旦发现AJAX请求跨域,就会自动添加一些附加的头信息,有时还会多出一次附加的请求,但用户不会有感觉。

因此,实现CORS通信的关键是服务器,只要服务器实现了CORS接口,就可以跨源通信。

# 两种请求

浏览器将CORS请求分成两类:简单请求(simple request)和非简单请求(not-so-simple request)。

只要同时满足以下两大条件,就属于简单请求。

  1. 请求方法是以下三种方法之一
    • HEAD
    • GET
    • POST
  2. HTTP的头信息不超出以下几种字段
    • Accept
    • Accept-Language
    • Content-Language
    • Last-Event-ID
    • Content-Type 只限于application/x-www-form-urlencoded、multipart/form-data、text-plain

凡是不同时满足上面两个条件,就属于非简单请求。浏览器对这两种请求的处理,是不一样的。

# 简单请求

对于简单请求,浏览器直接发出CORS请求,具体来说,就是在头信息中,增加一个 Origin 字段。下面是一个例子,浏览器发现这次跨源AJAX请求是简单请求,就自动在头信息之中,添加一个 Origin 字段。

GET /cors HTTP/1.1
Origin: http://api.bob.com
Host: api.alice.com
Accept-Language: en-US
Connection: keep-alive
User-Agent: Mozilla/5.0...

上面的头信息中,Origin 字段用来说明,本次请求来自哪个源。服务器根据这个值,决定是否同意这个请求。

如果 Origin 指定的源,不在许可范围内,服务器会返回一个正常的HTTP响应。浏览器发现,这个回应的头信息没有包含 Access-Control-Allow-Origin 字段,就知道出错了,从而抛出一个错误,被 XMLHttpRequestonerror 回调函数捕获。注意,这种错误无法通过状态码识别,因为HTTP回应的状态码有可能是200。

如果 Origin 指定的域名在许可范围内,服务器返回的响应,会多出几个头信息字段。

Accept-Control-Allow-Origin: http://api.bob.com
Accept-Control-Allow-Crendentials: true
Access-Control-Expose-Headers: Foobar
Content-Type: text/html; charset=utf-8

上面的头信息中,有三个与CORS请求相关的字段,都以 Access-Control- 开头。

  1. Access-Control-Allow-Origin

    该字段是必须的,它的值要么是请求时 Origin 字段的值,要么是一个 * ,表示接受任意域名的请求。

  2. Access-Control-Allow-Credentials

    该字段可选,它的值是一个布尔值,表示是否允许发送Cookie。默认情况下,Cookie不包括在CORS请求之中。设为 true ,即表示服务器明确许可,Cookie可以包含在请求中,一起发给服务器。这个值也只能设为 true 。如果服务器不要浏览器发送Cookie,删除该字段即可。

  3. Access-Control-Expose-Header

    该字段可选,CORS请求时,XMLHttpRequest 对象的 getResponseHeader() 方法只能拿到6个基本字段: Cache-ControlContent-LanguageContent-TypeExpiresLast-ModifiedPragma 。如果想拿到其他字段,就必须在 Access-Control-Expose-Header 里面指定。上面的例子指定,getReponseHeader('FooBar') 可以返回 FooBar 字段的值。

# withCredentials属性

上面说到,CORS请求默认不发送Cookie和HTTP认证信息。如果要把Cookie发到服务器,一方面要服务器同意,指定 Access-Control-Allow-Credentials 字段。

Access-Control-Allow-Credentials: true

另一方面,开发者必须在AJAX请求中打开 withCredentials属性。

var xhr = new XMLHttpRequest();
xhr.withCredentials = true;

否则,即使服务器同意发送Cookie,浏览器也不会发送。或者,服务器要求设置Cookie,浏览器也不会处理。

但是,如果省略 withCredentials 设置,有的浏览器还是会一起发送Cookie,这时,可以显示关闭 withCredentials

xhr.withCredentials = false;

需要注意的是,如果要发送Cookie, Access-Control-Allow-Origin 就不能设为星号,必须指定明确的、与请求网页一致的域名。同时,Cookie依然遵循同源策略,只有用服务器域名设置的Cookie才会上传,其他域名的Cookie并不会上传,且跨源原网页代码中的 document.cookie 也无法读取服务器域名下的Cookie。

# 非简单请求

# 预检请求

非简单请求是那种对服务器有特殊要求的请求,比如请求方法是 PUTDELETE ,或者 Content-Type 字段的类型是 application/json

非简单请求的CORS请求,会在正式通信之前,增加一次HTTP查询请求,称为 预检 请求(preflight)。

浏览器先询问服务器,当前网页所在的域名是否在服务器的许可名单之中,以及可以使用哪些HTTP动词和头信息字段,只有得到肯定答案,浏览器才会发出正式的 XMLHttpRequest 请求,否则就报错。下面是一段浏览器的Javascript脚本。

var url = 'http://api.alice.com/cors';
var xhr = new XMLHttpRequest();
xhr.open('PUT', url, true);
xhr.setRequestHeader('X-Custom-Header', 'value');
xhr.send();

上面代码中,HTTP请求的方法是 PUT ,并且发送一个自定义头信息 X-Custom-Header

浏览器发现,这是一个非简单请求,就自动发出一个预检请求,要求服务器确认可以这样请求。下面是这个预检请求的HTTP头信息。

OPTIONS /cors HTTP/1.1
Origin: http://api.bob.com
Access-Control-Request-Method: PUT
Access-Control-Request-Headers: X-Custom-Header
Host: api.alice.com
Accept-Language: en-US
Connection: keep-alive
User-Agent: Mozilla/5.0...

预检请求用的请求方法是 OPTIONS ,表示这个请求是用来询问的。头信息里面,关键字段是 Origin ,表示请求来自哪个源。出了 Origin 字段,预检请求的头信息包括两个特殊字段。

  1. Access-Control-Request-Method

    该字段是必须的,用来列出浏览器的CORS请求会用到哪些HTTP方法,上例是 PUT

  2. Access-Control-Request-Headers

    该字段是一个逗号分隔的字符串,指定浏览器CORS请求会额外发送的头信息字段,上例是 X-Custom-Header

# 预检请求的回应

服务器收到预检请求以后,检查了 OriginAccess-Control-Request-MethodAccess-Control-Request-Headers 字段以后,确认允许跨源请求,就可以做出响应。

HTTP/1.1 200 OK
Date: Mon,01 Dec 2017 20:15:15 GMT
Server: Apache/2.0.61 (Unix)
Access-Control-Allow-Origin: http://api.bob.com
Access-Control-Allow-Methods: GET, POST, PUT
Access-Control-Allow-Headers: X-Custom-Header
Content-Type: text-html; charset=utf-8
Content-Encoding: gzip
Content-Length: 0
Keep-Alive: timeout=2, max=100
Connection; Keep-Alive
Content-Type: text/plain

上面的HTTP回应中,关键的是 Access-Control-Allow-Origin 字段,表示 http://api.bob.com 可以请求数据。该字段也可以设为星号,表示同意任意跨源请求。

如果浏览器否定了预检请求,会返回一个正常的HTTP响应,但是没有任何CORS相关的头信息字段。这时,浏览器就会认定,服务器不同意预检请求,因此触发一个错误,被 XMLHttpRequest 对象的 onerror 回调函数捕获。控制台会打印出报错信息。

服务器回应的其他CORS相关字段如下:

Access-Control-Allow-Methods: GET, POST, PUT
Access-Control-Allow-Headers: X-Custom-Header
Access-Control-Allow-Credentials: true
Access-Control-Max-Age: 1728000
  1. Access-Control-Allow-Methods

    该字段必需,它的值是逗号分隔的一个字符串,表明服务器支持的所有跨域请求的方法。注意,返回的是所有支持的方法,而不单是浏览器请求的那个方法,这是为了避免多次预检请求。

  2. Access-Control-Allow-Headers

    如果浏览器请求包含 Access-Control-Request-Headers 字段,则 Access-Control-Allow-Headers 字段是必需的。它也是一个逗号分隔的字符串,表明服务器支持的所有头信息字段,不限于浏览器在预检请求中的字段。

  3. Access-Control-Allow-Credentials

    该字段域简单请求时的含义相同。

  4. Access-Control-Max-Age

    该字段可选,用来指定本次预检请求的有效期,单位为秒。上面结果中,有效期是1728000秒,即允许缓存该条回应1728000秒,在此期间,不用发出另一条预检请求。

# 浏览器的正常请求和回应

一旦服务器通过了预检请求,以后每次浏览器正常的CORS请求,就跟简单请求一样,会有一个 Origin 头信息字段,服务器的回应,也都会有一个 Access-Control-Allow-Origin头信息字段。下面是预检请求之后,浏览器的正常CORS请求。

PUT /cors HTTP/1.1
Origin: http://api.bob.com
Host: api.alice.com
X-Custom-Header: value
Accept-Language: en-US
Connection: keep-alive
User-Agent: Mozilla/5.0...

上面头信息的 Origin 字段是浏览器自动添加的。

下面是服务器正常的回应。

Access-Control-Allow-Origin: http://api.bob.com
Content-Type: text/html; charset=utf-8

上面头信息中,Access-Control-Allow-Origin 字段是每次回应都必定包含的。

# JSONP

客户端代码如下:

function handleResponse(response) {
    console.log('the response data is: ' + response.data);
}
var script = document.createElement('script');
script.src = 'http://www.example.com?callback=handleResponse';
document.body.insertBefore(script, document.body.firstChild);

JSONP 只能发送get请求,传递的参数大小有限。原理大致如下:用js动态创建一个script标签,其中src指向http://www.example.com?callback=handleResponse ,然后定义 handleResponse(response) 方法,最后将script标签添加到页面。script标签会自动向目标网站发送请求,在服务器端将数据作为参数同函数名一起返回。实际上是返回了<script>handleResponse(response)</script> 脚本文件,所以函数 handleResponse 会立即调用。

# Nginx反向代理

搭建一个nginx并把相应代码部署在它的线下面,由页面请求本域名的一个地址,转由nginx代理处理后返回结果给页面。

例如,前端调用的服务 /apis/xxx/xxx 和当前页是同源的,请求到nginx后由nginx转发到真正的请求地址。nginx.conf 配置一个反向代理路径:

location /apis {
    rewrite ^.+apis/?(.*)$ /$1 break;
    include uwsgi_params;
    proxy_pass http://www.example.com/xxx
}

参考:

浏览器和服务器实现跨域(CORS)判定的原理 (opens new window)

前端跨域问题的几种解决方案 (opens new window)

跨域资源共享 CORS 详解 (opens new window)

用nginx的反向代理机制解决前端跨域问题 (opens new window)

跨域方法:JSONP、iframe (opens new window)

使用 window.name 解决跨域问题 (opens new window)

Last Updated: 2/24/2020, 9:11:55 PM