Spark SQL开始_菜鸟教程

HTML/CSS

HTML 教程

HTML5 教程

CSS 教程

CSS3 教程

Bootstrap 教程

Foundation5 教程

HTML 参考手册

CSS 参考手册
JavaScript

JavaScript 教程

JavaScript 和 HTML DOM 参考手册

Vue.js 3.0 教程基础

Vue.js 2.0 教程

Vue CLI 基础

开发指南

React 教程

jQuery

Node.js 教程

TypeScript 教程

AngularJS 教程

JSON 教程

AJAX 教程

ES6教程

Angular 2 教程

jQuery UI 教程

jQuery EasyUI 教程

Ext.js 教程

Ember 对象模型

HTML DOM 教程

CoffeeScript 教程

Highcharts 教程

Meteor 教程
后端语言

Python3 教程

Python2 教程

Java 教程

Node.js 教程

PHP 教程

Go 教程

C 语言教程

C++ 教程

C# 教程

R 教程

Ruby 教程

JSP 教程

Lua 教程

ASP.NET 教程

VB 教程

VB.Net基本教程

Perl 教程

顺序编程

Scala 教程

Julia 教程
开发框架

Spring IoC 容器

Django 教程导读

JFinal教程手册

Swoole 教程

Groovy 教程

Servlet 教程

Struts2 教程

jUnit 教程

概要

SWING 教程

WordPress基础

Arduino教程

WPF 入门
数据库

MySQL 教程

Redis 教程

SQL 教程

MariaDB 教程

MyBatis 教程

SQLite 教程

MS Access教程

MongoDB 教程

Memcached 教程

Hibernate 教程

Storm 入门教程

Cassandra 教程

Slick 教程

Spark 编程指南
移动开发

鸿蒙OS 入门

微信小程序开发文档

Android 教程

Android SDK 上手指南

iOS 开发手册

jQuery Mobile 教程

Swift 教程

Cordova 教程

一、简介与环境搭建

React 教程

ionic 教程

HomeKit App 的开发指南

小程序云开发学习指南

云开发云函数实现后端能力
服务器相关

Linux 教程

Docker 教程

Docker 从入门到实践

DOS 命令学习手册

Nginx 入门指南

Shell 编程范例

UNIX 入门指南

OAuth 2.0 系列教程

Web Services 教程

Dart 编码风格指南

RDF 教程

第0章咱们先来谈谈学习方法和红帽系统。

-

Spark SQL开始

Spark中所有相关功能的入口点是SQLContext类或者它的子类，创建一个SQLContext的所有需要仅仅是一个SparkContext。

val sc: SparkContext // An existing SparkContext.
val sqlContext = new org.apache.spark.sql.SQLContext(sc)

// createSchemaRDD is used to implicitly convert an RDD to a SchemaRDD.
import sqlContext.createSchemaRDD

除了一个基本的SQLContext，你也能够创建一个HiveContext，它支持基本SQLContext所支持功能的一个超集。它的额外的功能包括用更完整的HiveQL分析器写查询去访问HiveUDFs的能力、从Hive表读取数据的能力。用HiveContext你不需要一个已经存在的Hive开启，SQLContext可用的数据源对HiveContext也可用。HiveContext分开打包是为了避免在Spark构建时包含了所有的Hive依赖。如果对你的应用程序来说，这些依赖不存在问题，Spark 1.2推荐使用HiveContext。以后的稳定版本将专注于为SQLContext提供与HiveContext等价的功能。

用来解析查询语句的特定SQL变种语言可以通过spark.sql.dialect选项来选择。这个参数可以通过两种方式改变，一种方式是通过setConf方法设定，另一种方式是在SQL命令中通过SET key=value来设定。对于SQLContext，唯一可用的方言是“sql”，它是Spark SQL提供的一个简单的SQL解析器。在HiveContext中，虽然也支持"sql"，但默认的方言是“hiveql”。这是因为HiveQL解析器更完整。在很多用例中推荐使用“hiveql”。