Google Storage for Developers初体验

周日还在写邮件询问Google Storage的事,它现在只针对美国开发者开放。周一还是意外收到邮件拿到了邀请,免不得晚上熬夜把玩了一番。现在收到邀请的开发者配额有100GB的数据存储空间和300GB的月流量,超过使用可以向他们开发团队申请增加。

Google Storage for Developers(简称GS)目前提供三种形式的管理工具,基于网页界面的Google Storage Manager,开源的命令行管理工具GSUtil ToolPython Library(改进过的boto,原为Amazon S3的)。

Google Storage Manager

Google Storage Manager的界面比较简单,只能新建Bucket(存储库),新建文件夹,批量上传,批量删除和共享文件,虽然GS有严格的访问控制权限(ACLs),但在Google Storage Manager里面还无法管理权限分配。同时还提供了一个类似书签的地方保存经常使用的存储库和文件夹用于快捷访问。
Google Storage Manager 不能单独使用IE访问,可以使用下面版本的浏览器访问:

  • Google Chrome 4.1+
  • Chrome Frame for IE
  • Firefox 3.6+
  • Safari 4.0+

这主要原因可能是IE原生不支持多文件的选取与上传。

GSUtil Tool

GSUtil Tool是更强大的命令行管理工具,可以安装在Linux和Mac OS上,也可以通过Cygwin安装在Windows上。第一次运行GSUtil Tool时候需要进行简单的配置,如果还没有手工配置直接输入命令就会出现提示,输入授权ID和访问KEY重新执行刚才的命令就可以了。

通过GSUtil Tool可以直接像操作本地文件一样操作远程文件,它提供一些类似本地shell的命令:
创建存储库

gsutil mb gs://cats gs://dogs

上传文件

gsutil cp *.jpg gs://dogs

列出存储库或文件

gsutil ls
gsutil ls gs://dogs

移动或改名

gsutil mv gs://dogs/*.jpg gs://cats/
gsutil mv gs://cats/poodle.jpg gs://cats/siamese.jpg

下载

gsutil cp gs://cats/*.jpg file://pets/

改变授权

gsutil setacl acls.txt gs://cats/siamese.jpg
gsutil setacl bucket-owner-full-control gs://cats/siamese.jpg

删除文件或者存储库

gsutil rm gs://cats/collie.jpg
gsutil rb gs://dogs

Python Library
Python Library是提供的一组Python API用于访问Google Storage,它源自boto(AS3的访问接口)。使用Python Library访问Google Storage仍然需要依赖GSUtil。目前Google App Engine已经支持使用Python Library访问Google Storage。

此外Google Storage API提供了非常RESTful的接口用于访问Google Storage,除了使用上面的工具,你还可以自己动手通过API访问Google Storage。
我在GAE上放了一个DEMO用于遍历存储库中文件及提供下载链接,欢迎测试速度

Demo源码下载 [下载没有找到]

题外话:
Google Storage的出现弥补了Google App Engine文件存储的缺陷,但是GAE文件执行时间的问题导致还是无法利用GAE来传送大文件到GS。虽然网站上已经对资源的标了价格,但目前Google还没有提供查询资源使用情况及付费的入口。另一方面GS比S3吸引力更大的地方是有免费配额,无疑为在项目初期选择它又多了一道砝码。
-EOF

在GAE中使用reCAPTCHA

Google App Engine是好东东,容易实现一些基于Web的小想法;reCAPTCHA也是好东西,大家都一起来防SPAM。而我就这么一点小乐趣,东搞搞西搞搞。
在GAE上面使用reCAPTCHA也很容易,并且已经有人写出来了具体怎么做,偶也依样画葫芦写了个演示,没有什么实际的功能,纯属瞎折腾看看自己验证码输对了没。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
#!/usr/bin/env python
import wsgiref.handlers
 
import os
from os import environ
from recaptcha.client import captcha
from google.appengine.ext import webapp
from google.appengine.ext.webapp import template
 
class MainHandler(webapp.RequestHandler):
  def get(self):
	chtml = captcha.displayhtml(
		public_key = "public_key",
		use_ssl = False,
		error = None)
	template_values = {
	'captchahtml': chtml
        }
    #self.response.out.write('Hello world!')
	path = os.path.join(os.path.dirname(__file__), 'index.html')
	self.response.out.write(template.render(path, template_values))
  def post(self):
	challenge = self.request.get('recaptcha_challenge_field')
	response  = self.request.get('recaptcha_response_field')
	remoteip  = environ['REMOTE_ADDR']
	cResponse = captcha.submit(
                    challenge,
                    response,
                    "PRIVATE-KEY",
                    remoteip)
	if cResponse.is_valid:
          # response was valid
          # other stuff goes here
          template_values = {
            'hello': "Hello world!"
            }
        else:
          error = cResponse.error_code
          chtml = captcha.displayhtml(
			public_key = "public_key",
			use_ssl = False, 
			error = cResponse.error_code)
          template_values = {
            'captchahtml': chtml
            }
 
	path = os.path.join(os.path.dirname(__file__), 'index.html')
	self.response.out.write(template.render(path, template_values))
 
 
def main():
  application = webapp.WSGIApplication([('/', MainHandler)],
                                       debug=True)
  wsgiref.handlers.CGIHandler().run(application)
 
 
if __name__ == '__main__':
  main()

-EOF-