本space主要想聚合Oralce技术专家的随笔和技术文章,另外整理和收集Oracle经典技术文章。
Oracle Warehouse Builder 11g 入门之使用平面文件事务数据
上一篇 /
下一篇 2008-03-28 10:06:14
/ 个人分类:Oracle Warehouse Builder
目的
平面文件是数据仓库项目的一种典型数据源。在本教程中,您将学习如何创建平面文件源模块。模块是项目中的存储对象,它们可帮助您以逻辑方式对源和目标对象定义进行分组。源模块保存的元数据用于描述源系统,您将从这些源系统中提取数据。目标模块保存的元数据则用于描述目标数据仓库或数据集市。
平面文件源模块定义了与包含一些平面文件示例的文件夹的连接。您将学习如何使用向导将平面文件元数据导入到平面文件源模块中。除了上机操作平面文件源之外,您还将看到一个有关 OWB 如何处理关系表数据库源的演示。
注: 本教程及其设置脚本仅支持 OWB 11g 第 1 版。该 Oracle 示例教程的早期版本可用于 OWB 10g 第 1 版和第 2 版。
主题
本教程包括下列主题:
概述
前提条件
创建平面文件源模块
导入平面文件元数据
检查 Oracle 数据库模块
总结
Warehouse Builder 需要元数据来描述产品中使用的源对象。为此,您要将源组织到一些称为模块的特定的元数据组中。模块引用 OS 目录或数据库模式。因此必须首先创建平面文件模块,然后再导入源中的元数据。无论对于文件还是模式中的表,要完成上述目的的过程都是相似的。
本教程主要讲述了如何定义一个存储平面文件元数据的源模块。您将学习如何使用 Import Metadata Wizard 来选择希望导入的平面文件,以及如何使用 Flat File Sample Wizard 来检查和记录平面文件的元数据。Flat File Sample Wizard 用于存储在 Warehouse Builder 库中定义的元数据。另外,在屏幕截图和说明的帮助下,您将了解如何检查 Oracle 数据库源模块。
开始学习本教程之前,您应已经:
| 1. | 下载了owbdemo_files.zip文件,并将该文件解压缩到一个驱动器上,如您计算机硬盘的 D 盘 |
| 2. | 完成了教程 1,继续以 rep_owner/rep_owner 用户身份登录 |
在本主题中,您将学习如何创建平面文件模块,之后您会向其中添加描述平面文件源的元数据。您现在创建的源模块最终将保存特定于平面文件的元数据;因此,此模块位于 Warehouse Builder Project Explorer 的 Files 节点中。
| 1. | 您已经以 rep_owner/rep_owner 用户身份登录到 Design Center 中。展开 Project Explorer 面板中的OWB_DEMO项目。右键单击Files节点,然后选择New。 
出现 Create Module Wizard:Welcome 页。单击Next。 
出现 Create Module Wizard:Name and Description 页。 |
| 2. | 在 Create Module Wizard:Name and Description 页中,输入SOURCE作为该模块的名称。单击Next。 
出现 Create Module Wizard:Connection Information 页。在平面文件源模块中,位置是指平面文件所在的文件系统中的路径或目录。 |
| 3. | 在 Create Module Wizard:Connection Information 页中,OWB 创建一个默认的位置,即 SOURCE_LOCATION1。单击Edit。 
出现 Edit File System Location:SOURCE_LOCATION1 窗口。 |
| 4. | 在 Edit File System Location:SOURCE_LOCATION1 窗口中,将默认名称 SOURCE_LOCATION1 重命名为SOURCE_LOCATION。单击Browse。 
在 Browse Directory 窗口中,选择D:\newowbdemo\sourcefiles或者您在其中保存安装脚本的驱动器和目录(包含有源文件夹)。单击Select。 |
| 5. | 在 Edit File System Location:SOURCE_LOCATION1 窗口中检查路径,然后单击OK。 
|
| 6. | 在 Connection Information 窗口中,请确保选择了Import after finish。选择此选项将启动 Import Metadata Wizard。单击Next。 提示:如果未选择该复选框,则 Import Metadata Wizard 不会自动启动。要手动启动 Import Metadata Wizard,在 Project Explorer 中展开Files,右键单击SOURCE模块,然后选择Import。 
出现 Create Module:Summary 页。 |
| 7. | 在 Summary 页中检查模块设置。单击Finish。 
此时,平面文件模块的定义已完成。Import Metadata Wizard 向导自动启动。如果您暂时将该向导移至一侧,您可以在 Design Center 中看到,在 Project Explorer 的 Files 节点中已经创建了该源模块。 |
创建了平面文件模块之后,您就可以将平面文件定义导入到 Warehouse Builder 中了。Import Metadata Wizard 将指导您完成导入元数据对象的全部过程。每次使用 Import Metadata Wizard 从现有平面文件导入元数据时,Import Metadata Wizard 都会启动 Flat File Sample Wizard。使用 Flat File Sample Wizard 可检查并记录平面文件的元数据。
使用 Import Metadata Wizard
| 1. | 在 Import Metadata Wizard:Welcome 页中,单击Next。 
出现 Import Metadata Wizard:Filter Information 页。 |
| 2. | 在 Import Metadata Wizard:Filter Information 页中,接受默认选择All Data Files,单击Next。 
此时出现 Import Metadata Wizard:Object Selection 页。 |
| 3. | 在 Import Metadata Wizard:Object Selection 页中,展开D:\newowbdemo\sourcefiles节点(或您在教程 1 中将安装文件解压缩到的其他任何位置)。显示文件列表。使用>> (Add All)将 Available 列表中的所有文件定义移至 Selected 列表。单击Next。 
出现 Import Metadata Wizard:Summary and Import页。 |
| 4. | 注:在此页中,您会看到两个前面带有红色叉号的文件定义(expense_categories_csv 和 export_csv)。红色叉号表示在 Warehouse Builder 库中没有此文件可用的元数据信息。导入之前,Warehouse Builder 需要了解这些文件的结构。通过该抽样过程,系统收集到了有关结构的信息。 在 Import Metadata Wizard:Summary and Import 页中,选择expense_categories_csv文件(如果尚未选择)。单击Sample。 
出现 Flat File Sample Wizard。 |
使用 Flat File Sample Wizard
| 1. | Flat File Sample Wizard 将引导您完成平面文件结构的定义。在 Flat File Sample Wizard:Welcome 页中,单击Next。 
出现 Flat File Sample Wizard:Name 页。 |
| 2. | 在 Flat File Sample Wizard:Name 页中,接受 EXPENSE_CATEGORIES_CSV 作为默认文件名。这是 Warehouse Builder 在该文件导入之后引用该文件时使用的名称。Warehouse Builder 提供了大量可用于读取数据的字符集。 接受此页上的默认值。此文件有 2 列:Expense Type 和 Expense Categories。此向导对该平面文件的结构作出假设。该对话框的下半部分显示了 OWB 如何将几行平面文件数据导入表列的示例。单击Next。 
出现 Flat File Sample Wizard:Record Organization 页。 |
| 3. | 注:使用 Record Organization 页可指定记录在抽样文件中的组织方式。 在 Flat File Sample Wizard:Record Organization 中,接受以回车 (<CR>) 分隔记录的默认选项。单击Next。 
出现 Flat File Sample Wizard:File Format 页。 |
| 4. | 注:您需要在此页上指定文件结构的格式。系统支持固定长度的文件和字符分隔文件。 提示:如果您的文件具有不同的分隔符,您可以在 Field Delimiter 下拉列表中输入它。Warehouse Builder 使用您输入的分隔符。 在 Flat File Sample Wizard:File Format 页中,接受文件格式的Delimited默认选项。单击Next。 
出现 Flat File Sample Wizard:File Layout 页。 |
| 5. | 注:您可以在此页中指定跳过的行数。对于记录类型,您可以选择单个记录或多个记录。 在 Flat File Sample Wizard:File Layout 页中,接受 Skip Rows 的默认值0。Expense_categories.csv 文件是单个记录类型文件的示例。为记录类型选择SingleRecord,然后单击Next。 
出现 Flat File Sample Wizard:Field Properties 页。 |
| 6. | 如果平面文件的第一个记录是标题,则可以使用第一个记录中的值作为字段名称。在 Flat File Sample Wizard:Field Properties 页中,选择Use the first record as the field names。 
注意下面屏幕截图中的字段名称已经更改。 提示:注意右侧的 SQL 数据类型,通过这些数据类型,您可以根据此文件控制外部表数据类型等内容。 单击Next。 
出现 Flat File Sample Wizard:Summary 页。 |
| 7. | 检查为文件 expense_categories_csv 定义的规格汇总。在 Flat File Sample Wizard:Summary页中,单击Finish。 
向导创建平面文件。Flat File Sample Wizard 会带您返回 Import Metadata Wizard。 |
| 8. | 在 Import Metadata Wizard:Summary and Import 页中,expense_categories_csv 的 Status 字段中的绿色对号表示 expense_categories_csv 已经过抽样。 
现在,您将继续抽样第二个平面文件。 |
| 9. | 选择 export_csv 文件(如果尚未选择)。单击Sample。 提示:为了节省时间,您可以在 Same As 下拉列表中选择Same As<文件名 >。(当要抽样的文件的结构与前面抽样过的任何一个文件相似时,必须使用 Same As 选项)。在此示例中,要抽样的两个文件的结构不相似。 
出现 Flat File Wizard:Welcome 页。单击Next。 |
| 10. | 在 Flat File Sample Wizard:Name 页中,接受 EXPORT_CSV 作为默认文件名。这是 Warehouse Builder 在该文件导入之后引用该文件时使用的名称。 接受此页上的默认值。此文件有 14 列。单击Next。 
出现 Flat File Sample Wizard:Record Organization 页。 |
| 11. | 注:使用 Record Organization 页可指定记录在抽样文件中的组织方式。 在 Flat File Sample Wizard:Record Organization 中,接受以回车 (<CR>) 分隔记录的默认选项。单击Next。 
出现 Flat File Sample Wizard:File Format 页。 |
| 12. | 注:您需要在此页上指定文件结构的格式。系统支持固定长度的文件和字符分隔文件。 在 Flat File Sample Wizard:File Format 页中,接受文件格式的Delimited默认选项。单击Next。 
出现 Flat File Sample Wizard:File Layout 页。 |
| 13. | 注:您可以在此页中指定跳过的行数。对于记录类型,您可以选择单个记录或多个记录。 在 Flat File Sample Wizard:File Layout 页中,接受 Skip Rows 的默认值0。export.csv 文件是单个记录类型文件的示例。为记录类型选择SingleRecord,然后单击Next。 
出现 Flat File Sample Wizard:Field Properties 页。 |
| 14. | 在 Flat File Sample Wizard:Field Properties 页中,选择Use the first record as the field names。如果平面文件的第一个记录是标题,则可以使用第一个记录中的值作为字段名称。 
请注意,此时字段名称已经更改。 
|
| 15. | 注:除非您已完成了步骤 15,否则不要单击向导页上的 Back 按钮。这可能会导致错误,原因在于日期是一个保留字,而您还没有重命名日期字段。 在 Flat File Sample Wizard:Field Properties 页中,选择 Date。 因为 Date 是保留字,所以需要将 Date 重命名为Expense_Date。 在 Type 下拉列表中选择Date。在 Mask 列中,键入dd-mon-yy(不带单引号)。 
|
| 16. | 在 Flat File Sample Wizard:Field Properties 页中,选择 Reimbursable_Amount_(USD)。 因为“(”和“)”都是保留字符,所以将 Reimbursable_Amount_(USD) 重命名为 Reimbursable_Amount。 在 Type 下拉列表中选择Decimal External。 
注:滚动到该对话框的右侧,查看 SQL Properties。向导根据您在 Tpe 列中的选择创建默认的 SQL Properties。 
单击Next。出现 Flat File Sample Wizard:Summary 页。 |
| 17. | 检查为文件 EXPORT_CSV 定义的规格汇总。在 Flat File Sample Wizard:Summary页中,单击Finish。 
向导创建平面文件。Flat File Sample Wizard 会带您返回 Import Metadata Wizard。 |
| 18. | 在 Import Metadata Wizard Summary and Import 页中,EXPENSE_CATEGORIES_CSV 和 EXPORT_CSV 的 Status 字段中的绿色对号表示两个文件均已经过抽样。在 Import Metadata Wizard:Summary and Import 页中,单击Finish。 此时导入过程开始。Importing Progress 对话框显示了导入进度。 
在 Project Explorer 中展开Files > SOURCE。您将看到刚刚抽样并导入的两个表(EXPENSE_CATEGORIES_CSV 和 EXPORT_CSV)。

在 Design Center 中,单击工具栏上的Save All 。在 Warehouse Builder Warning 窗口中,单击Yes提交您的工作。 |
除平面文件元数据源之外,您将创建一个用于各种其他源的模块,如用于基于 Oracle 的关系表源元数据的模块。涵盖的主题假定您的源数据已经以平面文件的形式存在。
在该子主题中,您将阅读一个有关如何从 Oracle 源中导出数据的演示。在本示例中,您将从一个 Oracle 数据库的模式中导出数据,该模式中存储有 HR 数据。下面的步骤仅供了解,无需执行。在说明和屏幕截图的帮助下,您能够理解这些概念。
| 1. | 请再次注意: 下面的步骤仅供了解,无需执行。 在这一步,您将了解如何创建 Oracle 模块。在 Project Explorer 中,展开项目OWB_DEMO>Databases。右键单击Oracle,选择New。在 Create Module -Welcome 页中,单击Next。 
在 Create Module Wizard:Name and Description 页中,输入HR作为 Oracle 数据源模块的名称。模块类型是Data Source。单击Next。 
|
| 2. | 向导的下一页是 Connection Information 页。OWB 为每一个已创建的模块创建一个位置名。正如您在屏幕截图中所看到的,位置名是 HR_LOCATION1。位置特定于 Oracle 数据库或平面文件等模块类型。 
|
| 3. | 单击 Edit 启动 Edit Oracle Database Location 页。在 Edit Oracle Database Location 页中,将默认的位置 HR_LOCATION1 重命名为HR_LOCATION。您还要提供连接信息(用户名、口令、主机、端口和服务名),它们用于指定元数据的源。在本示例中,提供的连接详细信息用于连接到 HR 模式。 提示:您可以使用各种连接类型:  | HOST:PORT:SERVICENAME |  | Database Link |  | SQL*NET Connection | 这使您能够在使用 TNS NAMES 条目的地方进行这样的配置(例如,针对 RAC),并且无需引用直接的单个节点。单击Test Connection。您提供的连接信息已经过测试,连接成功后将显示“Successful”消息。单击OK。 
|
| 4. | 在 Connection Information 页中,确保已选择Import after finish选项,进入 Import Metadata Wizard。 
单击Next。在 Summary 页中,单击Finish。 
出现 Import Metadata Wizard Welcome 页。单击Next。 |
| 5. | 利用 Import Metadata Wizard,您可以将元数据从数据库导入到模块中。选择您想导入到 HR Oracle 源模块中的对象。 在 Filter Information 页中,选择您想要导入的对象类型。 
单击Next。在 Object Selection 页中,选择您想要导入的具体对象。 
Warehouse Builder 将导入包括约束(如果存在的话)在内的所有定义。在本示例中,您选择了 COUNTRIES 表,Warehouse Builder 识别了通过一个外键关联的 REGIONS 表。在 Confirm Import Selection 对话框中,单击OK导入相关的 REGIONS 表。单击Next。 |
| 6. | 在 Summary and Import 页中,验证您已选择要导入 Warehouse Builder 的所有对象。您可以编辑对象的描述字段。 
单击Advanced Import Options检查各个导入选项,如屏幕截图所示。 
单击OK。单击Finish。在Import Results页中,单击OK。 您现在已经完成了 Oracle 数据库定义的导入。在 Oracle Warehouse Builder 客户端中,检查导入的元数据。展开HR模块并检查为表导入的元数据。 
|
在本教程中,您学习了如何:
 | 创建平面文件源模块。文件模块定义了与包含一些平面文件示例的文件夹的连接。 |
 | 为创建平面文件的定义,使用了: |
| Import Metadata Wizard 来导入平面文件 | |
| Flat File Sample Wizard 来对平面文件进行抽样 |
 | 简要检查 Oracle 数据库模块 |
导入论坛
引用链接
收藏
分享给好友
推荐到圈子
管理
举报
TAG:
11g
builder
oracle
warehouse